Software Engineering on SWE Verified HIGH reasoning

60.7Accuracy

gpt-oss-20b

Updated 17d ago

Evaluation Results

Method	Links
gpt-oss-20b 2026.04		60.7	-
HarmonyAgent 2026.04		60.4	56.2