Share your thoughts, 1 month free Claude Pro on usSee more

Mathematical & Geometric Reasoning on We-Math

77.7Accuracy@8

Qwen2.5-VL-32B + VPPO

Updated 4mo ago

Evaluation Results

Method	Links
Qwen2.5-VL-32B + VPPO 2025.10		77.7
Qwen2.5-VL-32B + GRPO 2025.10		76.7
Qwen2.5-VL-32B + DAPO 2025.10		76.2
NoisyRollout-32B 2025.10		75.7
MM-Eureka-32B 2025.10		75
Qwen2.5-VL-7B + VPPO 2025.10		71.5
NoisyRollout-7B 2025.10		71
Qwen2.5-VL-32B 2025.10		71
R1-ShareVL-7B 2025.10		69.9
VL-Rethinker-7B 2025.10		68.9
PAPO-D-7B 2025.10		68.3
Qwen2.5-VL-7B + GRPO 2025.10		68.1
Qwen2.5-VL-7B + DAPO 2025.10		68
ThinkLite-7B 2025.10		66.5
MM-Eureka-7B 2025.10		65.5
Qwen2.5-VL-7B 2025.10		46.4