Share your thoughts, 1 month free Claude Pro on usSee more

Multi-task Complex Understanding on MMLUPro STEM

71.9Accuracy

QwQ-32B-Preview*

Updated 4mo ago

Evaluation Results

Method	Links
QwQ-32B-Preview* 2025.02		71.9
Qwen2.5-Math-72B-Instruct 2025.02		66
Llama-3.1-70B-Instruct* 2025.02		61.7
OpenMath2-Llama3.1-70B* 2025.02		55
Eurus-2-7B-PRIME 2025.02		53.7
Qwen2.5-Math-7B-S2R-ORL 2025.02		50
Qwen2.5-Math-7B-S2R-BI 2025.02		49.8
Qwen2.5-Math-7B 2025.02		46
Qwen2.5-Math-7B-Instruct 2025.02		44.7