Share your thoughts, 1 month free Claude Pro on usSee more

Language Understanding on Multilingual MMLU internal translated version (Accuracy)

85.5Accuracy

GPT-4o

Updated 4mo ago

Evaluation Results

Method	Links
GPT-4o 2024.07		85.5
Llama 3 405B 2024.07		83.2
GPT-4 2024.07		80.2
Llama 3 70B 2024.07		78.2
Qwen 3 14B 2026.01		75.4
Ministral 3 14B 2026.01		74.2
Ministral 3 8B 2026.01		70.6
Qwen 3 8B 2026.01		70
Gemma 3 12B 2026.01		69
Qwen 3 4B 2026.01		67.7
Ministral 3 3B 2026.01		65.2
Mixtral 8×22B 2024.07		64.3
GPT-3.5 Turbo 2024.07		58.8
Llama 3 8B 2024.07		58.6
Gemma 3 4B 2026.01		51.6
Mistral 7B 2024.07		46.8