Share your thoughts, 1 month free Claude Pro on usSee more

Multilingual Knowledge on MMMLU

87.2Accuracy

GLM 4.6

Updated 4mo ago

Evaluation Results

Method	Links
GLM 4.6 2025.12		87.2
DeepSeek V3.2 2025.12		86.7
LongCat-Flash Exp-Chat 2025.12		85.2
LongCat-Flash Chat 2025.12		81.7
Qwen3-4B 2025.11		60.67
Granite-4.0-H 2025.11		56.13
LFM2-2.6B 2025.11		55.39
LFM2-8B-A1B 2025.11		55.26
Gemma-3-4B 2025.11		50.14
SmolLM3-3B 2025.11		50.02
Llama-3.2-3B 2025.11		47.92
LFM2-1.2B 2025.11		46.73
Qwen3-1.7B 2025.11		46.51
LFM2-700M 2025.11		43.28
Llama-3.2-1B 2025.11		38.15
LFM2-350M 2025.11		37.99
Gemma-3-1B 2025.11		34.43
Qwen3-0.6B 2025.11		30.84