Share your thoughts, 1 month free Claude Pro on usSee more

Multitask Language Understanding on MMMLU (non-EU languages, test)

77.4Accuracy

Qwen-3-30B-A3B

Updated 1mo ago

Evaluation Results

Method	Links
Qwen-3-30B-A3B 2026.02		77.4
Qwen-3-32B 2026.02		77
Llama-3.3-70B 2026.02		75.5
Mistral-3.2-24B 2026.02		72.5
Qwen-3-14B 2026.02		72.4
Gemma-3-27B 2026.02		72.1
Gemma-3-12B 2026.02		66.6
OLMo-3.1-32B 2026.02		63
EuroLLM-22B (new) 2026.02		61.1
EuroLLM-9B (new) 2026.02		57.7
Apertus-70B 2026.02		57.6
EuroLLM-22B (old) 2026.02		56.6
EuroLLM-9B (old) 2026.02		51.3
Apertus-8B 2026.02		50.9
Llama-3.1-8B 2026.02		50.2
OLMo-3-7B 2026.02		46.4