Share your thoughts, 1 month free Claude Pro on usSee more

Mathematical & Geometric Reasoning on MMK12

86.4Accuracy@8

Qwen2.5-VL-32B + DAPO

Updated 4mo ago

Evaluation Results

Method	Links
Qwen2.5-VL-32B + DAPO 2025.10		86.4
Qwen2.5-VL-32B + VPPO 2025.10		86.3
Qwen2.5-VL-7B + VPPO 2025.10		82.8
Qwen2.5-VL-7B + DAPO 2025.10		82.1
Qwen2.5-VL-32B + GRPO 2025.10		80.7
PAPO-D-7B 2025.10		80.6
MM-Eureka-32B 2025.10		73.4
Qwen2.5-VL-7B + GRPO 2025.10		72.3
R1-ShareVL-7B 2025.10		70.9
Qwen2.5-VL-32B 2025.10		68.8
VL-Rethinker-7B 2025.10		68.3
MM-Eureka-7B 2025.10		67.5
ThinkLite-7B 2025.10		62.6
NoisyRollout-32B 2025.10		60.2
NoisyRollout-7B 2025.10		50
Qwen2.5-VL-7B 2025.10		42.5