Share your thoughts, 1 month free Claude Pro on usSee more

Code Generation on EditBench

53.7Pass@1

GPT o4-mini

Updated 4mo ago

Evaluation Results

Method	Links
GPT o4-mini 2026.03		53.7	83.33
SEMREP 2026.03		53.7	88.89
QwQ-32B 2026.03		50.93	75
QwQ-32B 2026.03		47.22	76.85