Our new X account is live! Follow @wizwand_team for updates
WorkDL logo mark

General Capability Evaluation on tinyBenchmarks

90AI2_arc Accuracy

AAS

-3.620.74569.3Jan 27, 2026
Updated 4d ago

Evaluation Results

MethodLinks
2026.01
9091694745
2026.01
9093717459
2026.01
9094707459
2026.01
9093727557
2026.01
9093717459
2026.01
8793646359
2026.01
8794656359
2026.01
8692645761
2026.01
8185665651
2026.01
8086675649
2026.01
8088665551
2026.01
8088616053
2026.01
8082625750
2026.01
7988616153
2026.01
7981683649
2026.01
7981683649
2026.01
7885523450
2026.01
7788675747
2026.01
7365565843
2026.01
7278615737
2026.01
7180615736
2026.01
7170545538
2026.01
7169545640
2026.01
7081595642
2026.01
7072505145
2026.01
6978534947
2026.01
6972524847
2026.01
6775615934
2026.01
6676484343
2026.01
6164513935
2026.01
6164513935
2026.01
4743462131
2026.01
4646422231
2026.01
4535422036
2026.01
4140383135
2026.01
4168333936
2026.01
388131427
2026.01
2446152029
2026.01
1712732
2026.01
1712732
2026.01
8061810
2026.01
8083717
2026.01
10000
2026.01
10000
2026.01
00010
2026.01
00010
2026.01
00000
2026.01
00000