Share your thoughts, 1 month free Claude Pro on usSee more

Math Reasoning on AIME 22-24

8.15Score

Qwen3-4B + WeMask(SFT)

Updated 2mo ago

Evaluation Results

Method	Links
Qwen3-4B + WeMask(SFT) 2026.05		8.15
Qwen3-4B + SFT + WeMask(TF) 2026.05		7.61
Qwen3-4B + SFT + WeMask(TF) 2026.05		7.41
Qwen3-4B + WeMask(SFT) 2026.05		6.67
Qwen3-4B + SFT + WeMask(TF) 2026.05		6.3
Qwen3-4B + SFT + WeMask(TF) 2026.05		5.93
Qwen3-4B + SFT 2026.05		5.92
Qwen3-4B + WeMask(SFT) 2026.05		5.92
Qwen3-4B + WeMask(SFT) 2026.05		4.07
Qwen3-4B + SFT + WeMask(TF) 2026.05		3.33
Qwen3-4B + WeMask(SFT) 2026.05		1.48