IMO-Bench

Benchmarks

Task Name	Dataset Name	SOTA Result
Mathematical Reasoning	IMO-Bench	Accuracy57.02	57
Mathematical Reasoning	IMO-Bench 400	Pass@14.88	9
Mathematical Reasoning	IMO-Bench (n=460)	Tokens per Correct43,638	4

Showing 3 of 3 rows