Our new X account is live! Follow @wizwand_team for updates

General Knowledge on MMLU Redux

92.9Exact Match

OpenAI-o1-1217

Updated 4d ago

Evaluation Results

Method	Links
OpenAI-o1-1217 2025.01		92.9
DeepSeek-R1 2025.01		92.9
DeepSeek-V3 2025.01		89.1
Claude-3.5-Sonnet-1022 2025.01		88.9
GPT-4o-0513 2025.01		88
OpenAI-o1-mini 2025.01		86.7