Share your thoughts, 1 month free Claude Pro on usSee more

Multilingual Language Understanding on MMLU-ProX

78.1Accuracy

Qwen3-8B (Thinking)

Updated 12d ago

Evaluation Results

Method	Links
Qwen3-8B (Thinking) 2025.08		78.1
Qwen-3-30B-A3B 2026.02		72
OpenThoughts3-20k 2025.08		71.1
Qwen-3-32B 2026.02		70.1
Translated-s1k 2025.08		69
Distilled-s1k 2025.08		69
Qwen-3-14B 2026.02		66.1
Llama-3.3-70B 2026.02		65.7
Mistral-3.2-24B 2026.02		64.1
Gemma-3-27B 2026.02		60.2
OLMo-3.1-32B 2026.02		57
Gemma-3-12B 2026.02		53.3
EuroLLM-22B (new) 2026.02		45.3
OLMo-3-7B 2026.02		41.8
LANG 2026.05		41
LC-GRPO 2026.05		39.9
EuroLLM-22B (old) 2026.02		37.9
EuroLLM-9B (new) 2026.02		37.7
Apertus-70B 2026.02		36.5
Qwen2.5-7B-Instruct 2026.05		35.9
Llama-3.1-8B 2026.02		33.4
Apertus-8B 2026.02		29.5
EuroLLM-9B (old) 2026.02		29
Vanilla GRPO 2026.05		21