SOTA General Reasoning on Global MMLU 15 languages and PapersWithCode

54.77Macro Accuracy

Llama 3.1

Updated 2mo ago

Evaluation Results

Method	Links
Llama 3.1 2026.05		54.77
Cross-Lingual Consensus 2026.05		53.35