Share your thoughts, 1 month free Claude Pro on usSee more

Mathematical Reasoning on AIME 2025 (avg@10)

13.67Avg@10

SCR (Ours)

Updated 5mo ago

Evaluation Results

Method	Links
SCR (Ours) 2026.01		13.67
SFT + GRPO 2026.01		11.67
GRPO 2026.01		10.33
SCR-Stage I 2026.01		9
Base 2026.01		6
Self-Refine 2026.01		5.67
GRPO 2026.01		5
SCR (Ours) 2026.01		4.67
SCR-SFT 2026.01		4
SCR (Ours) 2026.01		4
SFT + GRPO 2026.01		3.67
Self-Refine 2026.01		3
Base 2026.01		2.33
SCR-SFT 2026.01		2.33
SCR-Stage I 2026.01		2
SCR-Stage I 2026.01		1.67
SCR-SFT 2026.01		1.33
GRPO 2026.01		1
SFT + GRPO 2026.01		0.67
Base 2026.01		0
Self-Refine 2026.01		0