Our new X account is live! Follow @wizwand_team for updates
WorkDL logo mark

Mathematical Reasoning on SVAMP

97Accuracy

GPT-4o + QuaSAR

83.06486.68290.393.918Jun 6, 2022Jan 16, 2023Aug 28, 2023Apr 9, 2024Nov 19, 2024Jul 1, 2025Feb 11, 2026
Updated 2d ago

Evaluation Results

MethodLinks
2025.02
97----
2025.02
95.3----
2024.05
94.8----
2024.02
94.8----
93.9----
93.7----
2026.01
93.4----
2026.02
93.3--608-
2025.11
93.2----
2026.01
93.1----
2026.02
93--656107
2026.02
93--612100
2026.02
93--47378
2024.05
92.9----
2024.10
92.6----
2026.01
92.4----
2026.01
92.2----
2023.04
91.92.07---
2026.02
91.8--12721
2025.11
91.76----
2026.01
91.6----
2025.11
90.53----
2023.04
90.5----
2026.01
90.5----
2025.02
90.4----
2024.05
90.4----
2026.01
90.4----
2025.02
90.3----
2024.05
90.3----
2026.01
90.3----
2026.02
90.3--54189
2025.11
90.29----
2024.05
90.2----
2024.05
90----
2026.02
90--697115
2026.02
90--30149
2026.02
90--34152
2024.05
89.9----
2026.01
89.7----
2025.11
89.64----
2026.02
89.6----
2025.11
89.52----
2025.02
89.5----
2025.03
89.5----
2024.05
89.4----
2024.05
89.2----
2024.05
89.2----
2023.04
89.1----
2026.01
89.1----
2025.03
88.9----
2025.02
88.7----
2025.11
88.48----
2026.01
88.3----
2026.01
88.3----
88.26----
2025.02
88.1----
2025.11
88.06----
2025.11
87.92----
2024.02
87.8----
2025.03
87.4----
2024.09
87.33----
2024.05
87.3----
2026.02
87.3--20834
2025.11
87.02----
2022.06
87----
2026.01
86.8----
2022.06
86.6----
2024.09
86.33----
2025.11
86.24----
2024.05
86.2----
86----
2025.02
85.9----
2026.02
85.9----
2022.06
85.8----
2026.02
85.7--50283
2024.09
85.67----
2026.01
85.5----
2025.02
85.3----
2025.02
85.1----
2026.02
85.1----
2024.02
85----
2026.01
85----
2025.02
84.9----
2025.02
84.6----
2024.03
84.6----
2026.01
84.5----
2026.02
84.5----
2024.09
84.33----
2025.02
84.3----
2024.02
84.3----
2025.03
84.3----
2025.02
84.2----
2026.01
84.1----
2024.09
84----
2026.01
84----
2024.03
83.8----
2024.05
83.7----
2024.05
83.7----
2024.03
83.7----
2024.02
83.6----
Showing 100 of 368 rows