Share your thoughts, 1 month free Claude Pro on usSee more

Mathematical Reasoning on LMB Hard

46.2Accuracy

Qwen2.5-32B-Instruct + Bootcamp-SFT-RL

Updated 1mo ago

Evaluation Results

Method	Links
Qwen2.5-32B-Instruct + Bootcamp-SFT-RL 2025.08		46.2
DS-R1-Distilled-Qwen-32B + Bootcamp-RL 2025.08		43.7
DS-R1-Distilled-Qwen-32B 2025.08		36.8
Qwen2.5-32B-Instruct + Bootcamp-SFT 2025.08		33.2
Qwen2.5-32B-Instruct 2025.08		22
Qwen2.5-32B-Instruct + Bootcamp-RL 2025.08		21.8
OPDLM-8B 2026.06		20
OPDLM-4B 2026.06		11.1
SDAR-8B 2026.06		8.9
Fast-dLLM-v2-7B 2026.06		8.9
SDAR-4B 2026.06		6.9