Share your thoughts, 1 month free Claude Pro on usSee more

Abstract Visual Reasoning on ARC-AGI 1

98Accuracy (Pass@2)

best.human

Updated 3mo ago

Evaluation Results

Method	Links
best.human 2026.02		98
Bespoke (Grok-4) 2026.02		79.6
Bespoke (Grok-4) 2026.04		79.6
Grok-4-thinking 2026.02		66.7
Grok-4-thinking 2026.04		66.7
Loop-ViT (Large) 2026.02		65.8
Loop-ViT (Medium) 2026.02		63.8
VARC (ensemble) 2026.02		60.4
avg.human 2026.02		60.2
Loop-ViT (Small) 2026.02		60.1
Enc-Dec ViT+KoPE 2026.04		56.8
Enc-Dec ViT 2026.04		54.7
VARC 2026.02		54.5
ViT 2026.04		54.5
ViT 2026.04		53
TRM 2026.02		44.6
TRM 2026.04		44.6
GPT-5 2026.02		44
GPT-5 2026.04		44
HRM 2026.02		40.3
HRM 2026.04		40.3
o3-mini-high 2026.02		34.5
o3-mini-high 2026.04		34.5
Claude 3.7 8k 2026.02		21.2
Claude 3.7 8k 2026.04		21.2
Deepseek R1 2026.02		15.8
Deepseek R1 2026.04		15.8