Our new X account is live! Follow @wizwand_team for updates

Mathematical Reasoning on AIME'25 (Accuracy Avg@32)

59.69Accuracy (Avg@32)

PPPO

Updated 4d ago

Evaluation Results

Method	Links
PPPO 2025.12		59.69
PPPO 2025.12		53.44
DAPO-FT 2025.12		49.38
DAPO 2025.12		48.75
GRPO 2025.12		42.29
DAPO 2025.12		42.08
DAPO-FT 2025.12		42.08
INTUITOR 2025.12		40.83
Qwen3-8B 2025.12		38.75
GRPO 2025.12		37.71
Qwen3-4B 2025.12		35.42
INTUITOR 2025.12		35.42
PPPO 2025.12		28.96
DAPO-FT 2025.12		23.96
DAPO 2025.12		23.33
GRPO 2025.12		20
Qwen3-1.7B 2025.12		18.33
INTUITOR 2025.12		17.71