AMO-Bench

Benchmarks

Task Name	Dataset Name	SOTA Result
Mathematical Reasoning	AMO-Bench	Avg@50.646	48
Mathematical Reasoning	AMO-Bench	Mean@64 Accuracy11.8	27
Mathematical Reasoning	AMO-Bench	Average@1614.8	24
Mathematical Reasoning	AMO-Bench	Accuracy (Acc)20.5	20
Mathematical Reasoning	AMO-Bench	Pass@836.72	20
Mathematical Reasoning	AMO-Bench	Seed (Avg@5)0.56	16
Mathematical Reasoning	AMO-Bench	Pass@1 Score2.6	8
Mathematical Reasoning	AMO-Bench	AMO-Bench Accuracy59.8	6
Mathematical Reasoning	AMO-Bench VeRA-H / VeRA-H Pro	Avg@5 Accuracy (Seeds)31.75	1

Showing 9 of 9 rows