Share your thoughts, 1 month free Claude Pro on usSee more

Mathematical Reasoning on AIME 2024 (Pass@1, Pass@16, Token Metrics)

13.5Mean@16

OptPO-SFT

Updated 1mo ago

Evaluation Results

Method	Links
OptPO-SFT 2025.12		13.5	50	20	-	0.61
TTSFT 2025.12		13.1	46.7	20	-	-
OptPO-SFT 2025.12		6.2	36.7	3.3	-	15.33
TTSFT 2025.12		3.8	26.7	6.7	-	-