Mathematical Reasoning on AIME 2025 (Avg@10 and Pass@10)

50Avg@10

Qwen3-4B RL finetuned on HanabiRewards

Updated 4d ago

Evaluation Results

Method	Links
Qwen3-4B RL finetuned on HanabiRewards 2026.01		50	73.3
Qwen3-4B-Instruct-2507 2026.01		48.7	73.3