Share your thoughts, 1 month free Claude Pro on usSee more

Mathematical Reasoning on AMC (Pass@16, Mean@16, Token Usage)

47.06Mean @16

ME-ICPO

Updated 4mo ago

Evaluation Results

Method	Links
ME-ICPO 2026.03		47.06	-	-	-	-
TTRL 2026.03		45.18	-	-	-	-
OptPO-SFT 2025.12		39.7	81.9	43.4	-	12.08
TTSFT 2025.12		37.9	80.7	42.2	-	-
ToT (Maj vote) 2026.03		29.37	-	-	-	-
TTSFT 2025.12		20.1	63.9	28.9	-	-
OptPO-SFT 2025.12		18.7	60.2	19.3	-	17.16
ToT (self eval) 2026.03		16.19	-	-	-	-
MCTR 2026.03		1.2	-	-	-	-