Share your thoughts, 1 month free Claude Pro on usSee more
WorkDL logo mark

Science Reasoning on ARC-C

97Accuracy

Qwen3-Next-80B + THINKBRAKE

48.53661.11873.786.282Oct 1, 2025
Updated 12d ago

Evaluation Results

MethodLinks
2025.10
97-21.8-
2025.10
96.8--
2025.10
96.2-8.1-
2025.10
96.2-8.1-
2025.10
95.9--
2025.10
95.9--
2025.10
95.2-18.2-
2025.10
95.2-18.2-
2025.10
95.1-100-
2025.10
94.7-17.9-
2025.10
94.5-39.1-
2025.10
94.5-39.1-
2025.10
94.3--
2025.10
94.3-100-
2025.10
94.3--
2025.10
94.2-100-
2025.10
94.2-100-
2025.10
94-19.9-
2025.10
94--
2025.10
94-19.9-
2025.10
94--
2025.10
93.9-11.5-
2025.10
93.9-11.5-
2025.10
93.7-31.7-
2025.10
93.7-31.7-
2025.10
93.4-14.4-
2025.10
93.4-15-
2025.10
93.4-14.4-
2025.10
92.8-9-
2025.10
92.8-9-
2025.10
92.714.6-
2025.10
92.714.6-
2025.10
92.2-11.7-
2025.10
92.1--
2025.10
92.1--
2025.10
91-8-
2025.10
91-8-
2025.10
90.19-
2025.10
90.19-
2025.10
89.3-100-
2025.10
84.2-49.2-
2025.10
82.7-100-
2025.10
80--
2025.10
80-25.3-
2025.10
80--
2025.10
80-25.3-
2025.10
77.8-53.6-
2025.10
77.6-7-
2025.10
77.6-7-
2025.10
73.9-10.6-
2025.10
70.7-35.3-
2025.10
70.7-35.3-
2025.10
67.7--
2025.10
67.7--
2025.10
67.2-31-
2025.10
64.6-12.6-
2025.10
64.6-12.6-
2025.10
50.4-100-
2026.05
--87.1
2026.05
--88
2026.05
--88.3
2026.05
--88.5
2026.05
--89
2026.05
--89.5
2026.05
--89.8
2026.05
--89.6
2026.05
--90
2026.05
--83.5
2026.05
--84.6
2026.05
--84.8
2026.05
--85
2026.05
--85.4
2026.05
--86.2
2026.05
--86.8
2026.05
--86.4
2026.05
--87