Share your thoughts, 1 month free Claude Pro on usSee more

Mathematical Reasoning on AIME 25 (Correction Uplift %)

27.59Correction Uplift

ROSA

Updated 4mo ago

Evaluation Results

Method	Links
ROSA 2025.09		27.59
ROSA 2025.09		20.69
ROSA 2025.09		16.67
ROSA 2025.09		13.79
Baseline 2025.09		7.41
ROSA 2025.09		6.67
Baseline 2025.09		3.57
Baseline 2025.09		3.57
Baseline 2025.09		3.57
Baseline 2025.09		0