HumanE

Benchmarks

Task Name	Dataset Name	SOTA Result
Code Generation	HumanE	Accuracy85.2	82
Code Reasoning	HumanE	Accuracy84.9	35
Code Generation	HumanE	Pass@192.11	11

Showing 3 of 3 rows