Share your thoughts, 1 month free Claude Pro on usSee more
WorkDL logo mark

Mathematical Reasoning on MathQA

98.84Accuracy

Claude Opus 4.6 + Claude Haiku 4.5

39.830455.150270.4785.7898May 22, 2023Nov 13, 2023May 6, 2024Oct 28, 2024Apr 21, 2025Oct 13, 2025Apr 7, 2026
Updated 2d ago

Evaluation Results

MethodLinks
2026.04
98.84-123.87--
2026.02
90----
2026.02
88.67----
2025.09
88.38---
2025.09
87.73.87---
2026.02
87----
2026.02
86----
2026.02
86----
2026.02
85----
2025.09
858---
2025.09
84.75.08---
2025.09
84.13.79---
2026.02
84----
2026.02
84----
2026.02
84----
2026.02
83.59----
2023.05
83.2----
2026.02
83----
2026.02
83----
2026.02
82.81----
2026.02
82.03----
2026.02
82----
2025.09
81.88---
2025.09
80.54.48---
2026.02
80.47----
2025.02
80.4----
2026.02
80----
2026.02
79.69----
2025.09
79.68---
2025.09
79.66.06---
2025.09
79.14.35---
2026.02
79----
2026.02
79----
2026.02
79----
2026.02
79----
2026.02
77----
2025.02
76.3----
2026.02
76----
2026.02
76----
2025.02
75.8----
2025.02
75.3----
2026.02
75----
2026.02
74----
2025.02
73.9----
2026.02
73----
2026.02
73----
2025.02
72.9----
2025.02
71.9----
2025.02
71.8----
2023.05
71.4----
2025.02
71.2----
2026.02
71----
2026.02
71----
2026.02
71----
2026.02
70----
2025.02
69.4----
2026.02
69----
2026.02
69----
2025.02
66.7----
2026.02
64----
2026.02
61.71----
2023.05
61.7----
2026.02
60.15----
2025.09
59----
2026.02
57----
2024.10
56.04----
2026.02
55----
2024.10
54.67----
2024.03
54.01----
2024.10
53.96----
2024.10
53.9----
2024.10
53.56----
2026.02
53----
2026.02
53----
2026.02
53----
2024.10
51.42----
2023.05
50.6----
2025.09
50----
2024.10
48.77----
2024.10
48.17----
2026.02
48----
2024.10
45.42----
2026.03
45.2----
2026.03
44.9----
2026.03
44.5----
2026.03
44.1----
2026.03
44.1----
2026.02
44----
2026.02
44----
2024.03
43.95----
2026.03
43.8----
2026.01
42.91----
2026.01
42.58----
2026.01
42.48----
2026.01
42.38----
2026.01
42.31----
2026.01
42.24----
2026.01
42.24----
2026.04
42.1----
2026.03
42.1----
Showing 100 of 339 rows