Our new X account is live! Follow @wizwand_team for updates
WorkDL logo mark

Mathematical Reasoning on MATH500 (full)

92.4Accuracy

Deepseek-v3-RMoA

46.036858.073470.1182.1466May 30, 2025Jul 11, 2025Aug 22, 2025Oct 3, 2025Nov 14, 2025Dec 26, 2025Feb 6, 2026
Updated 4d ago

Evaluation Results

MethodLinks
2025.05
92.4
2025.05
89.4
2026.02
88.8
2026.02
88.55
2025.05
88.2
2025.05
87.8
2026.02
87.72
2026.02
87.66
2026.02
87.57
2026.02
86.98
2026.02
86.72
2026.02
86.54
2026.02
86.33
2026.02
85.63
2026.02
85.29
2026.02
85.08
2026.02
84.93
2026.02
84.83
2026.02
84.76
2026.02
84.67
2026.02
84.57
2026.02
84.27
2025.05
84.2
2026.02
84.09
2026.02
83.73
2026.02
83.4
2026.02
83.39
2026.02
82.79
2026.02
82.71
2026.02
82.07
2026.02
81.69
2026.02
81.56
2026.02
80.71
2026.02
80.38
2025.05
80
2026.02
79.96
2026.02
79.29
2026.02
79.24
2026.02
78.7
2026.02
78.69
2026.02
78.19
2026.02
77.88
2026.02
77.12
2026.02
76.76
2026.02
75.88
2026.02
74.59
2026.02
73.96
2026.02
73.14
2026.02
72.43
2026.02
72.19
2026.02
71.25
2026.02
71.19
2026.02
70.87
2026.02
70.46
2026.02
69.88
2026.02
69.26
2026.02
69.11
2026.02
68.72
2026.02
67.66
2026.02
67.64
2026.02
67.26
2026.02
67.12
2026.02
66.64
2026.02
66.12
2026.02
65.95
2026.02
65.94
2026.02
65.4
2026.02
65.09
2026.02
64.48
2026.02
63.71
2026.02
63.29
2026.02
62.67
2026.02
61.77
2026.02
61.52
2026.02
60.95
2026.02
60.45
2026.02
60.04
2026.02
58.74
2026.02
58.19
2026.02
58.05
2026.02
56.57
2026.02
56.27
2026.02
55.59
2026.02
55.45
2026.02
55.38
2026.02
55.17
2026.02
55.12
2026.02
54.46
2026.02
53.53
2026.02
53.09
2026.02
52.81
2026.02
52.57
2026.02
52.47
2026.02
51.77
2026.02
51.3
2026.02
50.83
2026.02
50.57
2026.02
49.74
2026.02
48.87
2026.02
47.82
Showing 100 of 111 rows