Share your thoughts, 1 month free Claude Pro on usSee more

Multitask Language Understanding on ArabicMMLU

72.5Accuracy

GPT-4

Updated 5mo ago

Evaluation Results

Method	Links
GPT-4 2024.12		72.5
LLaMA3-Tamed-70B 2024.12		66.56
Llama3-70B 2024.12		65.51
Qwen1.5-72B 2024.12		61.23
ChatGPT 3.5 Turbo 2024.12		57.7
Qwen1.5-32B 2024.12		55.94
LLaMA3-Tamed-8B 2024.12		50.17
Qwen2.5 2025.12		47.2
Gamayun 2025.12		47
Qwen1.5-7B 2024.12		46.41
Qwen3 2025.12		46.3
Llama3-8B 2024.12		45.78
Jais-30B-v3 2024.12		44.47
Gemma3 2025.12		39.8
Llama3.2 2025.12		37.2
EuroLM 2025.12		26.8