Share your thoughts, 1 month free Claude Pro on usSee more

Reasoning on CorrectBench

0.8256Accuracy

MP

Updated 5mo ago

Evaluation Results

Method	Links
MP 2026.02		0.8256
Ann Brown 2026.02		0.8256
CoT 2026.02		0.8215
Std 2026.02		0.7903
CoT 2026.02		0.7502
MP 2026.02		0.7486
Ann Brown 2026.02		0.6814
Std 2026.02		0.5291