Our new X account is live! Follow @wizwand_team for updates

General Knowledge on MMLU (EM)

91.8EM

OpenAI-o1-1217

Updated 4d ago

Evaluation Results

Method	Links
OpenAI-o1-1217 2025.01		91.8
DeepSeek-R1 2025.01		90.8
DeepSeek-V3 2025.01		88.5
Claude-3.5-Sonnet-1022 2025.01		88.3
GPT-4o-0513 2025.01		87.2
OpenAI-o1-mini 2025.01		85.2