Share your thoughts, 1 month free Claude Pro on usSee more

Mathematical Reasoning on AIME 2025 (p@1, p@16)

82.08P@1

DoLa

Updated 1mo ago

Evaluation Results

Method	Links
DoLa 2026.02		82.08	93.33
CoT 2026.02		81.25	90
LED 2026.02		81.04	93.33
ST-G 2026.02		79.79	93.33
LED 2026.02		76.46	90
ST 2026.02		75.21	90
CoT 2026.02		74.17	90
ST 2026.02		72.29	83.33
DoLa 2026.02		72.08	86.67
ST-G 2026.02		67.5	90
LED 2026.02		60.62	83.33
CoT 2026.02		59.17	80
DoLa 2026.02		59.17	80
ST-G 2026.02		59.17	80
ST 2026.02		54.79	80