Share your thoughts, 1 month free Claude Pro on usSee more

Code Generation on HumanEval (ΔPPL)

14.8ΔPPL (%)

CE

Updated 1mo ago

Evaluation Results

Method	Links
CE 2026.05		14.8
CE 2026.05		14.3
CE 2026.05		13.9
CE 2026.05		12.8
CE 2026.05		12.5
CE 2026.05		12.1
CE 2026.05		10.5
CE 2026.05		9.5
Base 2026.05		5.12
Base 2026.05		3.45
CE + TMKL 2026.05		0.8
CE + TMKL 2026.05		0.7
CE + TMKL 2026.05		0.5
CE + TMKL 2026.05		0.2
CE + TMKL 2026.05		0.1
CE + TMKL 2026.05		-0.5
CE + TMKL 2026.05		-0.6
CE + TMKL 2026.05		-0.8