Share your thoughts, 1 month free Claude Pro on usSee more

Constraint satisfaction on ZL-XXL

97.7Accuracy (%)

Gemini 2.5 Pro+ASP

Updated 2mo ago

Evaluation Results

Method	Links
Gemini 2.5 Pro+ASP 2026.04		97.7
o4-mini+ASP 2026.04		76.7
DS-R1-0528+ASP 2026.04		75
Gemini 2.5 Flash+ASP 2026.04		70.3
DS-V3+ASP 2026.04		37
o4-mini 2026.04		34
Gemini 2.5 Pro 2026.04		32.3
DS-R1-0528 2026.04		27.7
Gemini 2.5 Flash 2026.04		20
DS-V3 2026.04		7