Share your thoughts, 1 month free Claude Pro on usSee more

Mathematical Reasoning on AIME 2025 (Reward-weighted Pass@1)

4.3Reward-weighted Pass@1

AIRL (Interval)

Updated 3mo ago

Evaluation Results

Method	Links
AIRL (Interval) 2025.10		4.3
AIRL (Sparse) 2025.10		3.82
SFT 2025.10		3.12
AIRL (Step-wise) 2025.10		2.82
AIRL (Dense) 2025.10		2.17
AIRL (Sparse) 2025.10		1.67
SFT 2025.10		1.42
AIRL (Step-wise) 2025.10		0.84
AIRL (Interval) 2025.10		0.36
AIRL (Dense) 2025.10		0.36