Share your thoughts, 1 month free Claude Pro on usSee more

Multiple-Choice Question Answering on Mechanistic Interpretability Benchmark (MIB) MCQA (standard)

0.04CMD

EAP-IG-inputs

Updated 5mo ago

Evaluation Results

Method	Links
EAP-IG-inputs 2026.02		0.04	0.96
EAP-IG-inputs 2026.02		0.05	95
EAP-IG-inputs 2026.02		0.05	95
EAP 2026.02		0.05	0.95
EAP 2026.02		0.06	94
Circuit Fingerprint 2026.02		0.07	0.93
Circuit Fingerprint 2026.02		0.09	92
EAP 2026.02		0.13	0.87
Circuit Fingerprint 2026.02		0.13	0.87