Share your thoughts, 1 month free Claude Pro on usSee more

Mathematical & Geometric Reasoning on DynaMath (accuracy@8)

73.1Accuracy@8

Qwen2.5-VL-32B + VPPO

Updated 4mo ago

Evaluation Results

Method	Links
Qwen2.5-VL-32B + VPPO 2025.10		73.1
Qwen2.5-VL-32B + DAPO 2025.10		72.6
NoisyRollout-32B 2025.10		72.2
MM-Eureka-32B 2025.10		72
Qwen2.5-VL-32B + GRPO 2025.10		71.6
Qwen2.5-VL-32B 2025.10		68.7
Qwen2.5-VL-7B + VPPO 2025.10		68.1
PAPO-D-7B 2025.10		66.8
Qwen2.5-VL-7B + DAPO 2025.10		66.6
Qwen2.5-VL-7B + GRPO 2025.10		65.8
VL-Rethinker-7B 2025.10		65.7
NoisyRollout-7B 2025.10		65.5
MM-Eureka-7B 2025.10		65.4
R1-ShareVL-7B 2025.10		65.1
ThinkLite-7B 2025.10		64.6
Qwen2.5-VL-7B 2025.10		55.7