Share your thoughts, 1 month free Claude Pro on usSee more

Multi-agent Reasoning on MMLU

91.02Accuracy

Single Best

Updated 2mo ago

Evaluation Results

Method	Links
Single Best 2025.10		91.02
OW-L 2025.10		90.37
OW-I 2025.10		90.37
ISP 2025.10		90.01
MV 2025.10		89.32
OW-I 2025.10		88.64
OW-L 2025.10		88.49
ISP 2025.10		87.92
MV 2025.10		87.19