Share your thoughts, 1 month free Claude Pro on usSee more
WorkDL logo mark

Mathematical Reasoning on HMMT Feb 2025

99.4Accuracy

GPT-5.2 (xhigh)

6.42430.56254.778.838Dec 2, 2025Dec 24, 2025Jan 15, 2026Feb 6, 2026Feb 28, 2026Mar 22, 2026Apr 14, 2026
Updated 4d ago

Evaluation Results

MethodLinks
2026.02
99.4---
2025.12
99.227--
2025.12
97.516--
2026.02
97.316--
2026.02
97.3---
2026.02
95.427--
2026.02
95.4---
2026.04
94.73---
2026.04
93.67---
2026.02
92.9---
2026.02
92.519--
2026.02
92.5---
2025.12
92.519--
2026.04
91.4---
2026.04
90---
2026.04
89.55---
2026.02
89.435--
2025.12
89.431--
2025.12
88.316--
2026.02
34.4---
2026.02
33.9---
2026.02
32.5---
2026.02
32.5---
2026.02
32.4---
2026.02
32.4---
2026.02
31.7---
2026.02
30.7---
2026.02
10---
2026.01
--1.3-
2026.01
--4-
2026.01
--3.5-
2026.01
--1.3-
2026.01
--6-
2026.01
--1-
2026.01
--5.4-
2026.01
--5.6-
2026.01
--4.3-
2026.01
--12.9-
2026.01
--10-
2026.01
--11.9-
2026.01
--12.3-
2026.01
--11.8-
2026.01
--12.7-
2026.03
---41.7
2026.03
---79.4
2026.03
---62.5
2026.03
---83.9
2026.03
---66.7
2026.03
---82.5
2026.03
---59.2
2026.03
---56.6
2026.03
---59.2
2026.03
---36.7
2026.03
---40
2026.03
---65.7