Deploy FairSteer Layer 14 (Acc: 67.90%)

Files changed (5) hide show

README.md CHANGED Viewed

@@ -20,7 +20,7 @@ This model detects whether an LLM's internal activation indicates biased reasoni
 - **Base Model**: TinyLlama/TinyLlama-1.1B-Chat-v1.0
 - **Target Layer**: 14
 - **Architecture**: Linear Probe (Dropout -> Linear)
-- **Performance**: 68.52% Balanced Accuracy
 ## Artifacts
 - `model.safetensors`: Weights (SafeTensors only)

 - **Base Model**: TinyLlama/TinyLlama-1.1B-Chat-v1.0
 - **Target Layer**: 14
 - **Architecture**: Linear Probe (Dropout -> Linear)
+- **Performance**: 67.90% Balanced Accuracy
 ## Artifacts
 - `model.safetensors`: Weights (SafeTensors only)

config.json CHANGED Viewed

@@ -3,7 +3,7 @@
     "layer_idx": 14,
     "input_dim": 2048,
     "dropout_rate": 0.25,
-    "best_metric_value": 0.6852288021534321,
     "architecture": "Linear Probe (Dropout -> Linear)",
-    "training_timestamp": "2025-12-14T14:25:17.892899"
 }

     "layer_idx": 14,
     "input_dim": 2048,
     "dropout_rate": 0.25,
+    "best_metric_value": 0.6790040376850606,
     "architecture": "Linear Probe (Dropout -> Linear)",
+    "training_timestamp": "2025-12-15T07:04:57.057892"
 }

layer_comparison.png CHANGED Viewed

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0867317f2e7bfcee4dec2ff7af85ccf42f8ccc89431132752feea8cebc09a47a
 size 8348

 version https://git-lfs.github.com/spec/v1
+oid sha256:25a7acb5831932b170171f017d9f4f88b0594808f8567d1abaa082c4bff47ded
 size 8348

training_dashboard.png CHANGED Viewed