Share your thoughts, 1 month free Claude Pro on usSee more

Code Generation on HumanEval+ (Score)

34.76Score

ARES-RL

Updated 19d ago

Evaluation Results

Method	Links
ARES-RL 2026.05		34.76
Webscale 2026.05		33.54
NaturalReasoning 2026.05		32.93
CPT 2026.05		32.32
ARES-SFT 2026.05		31.1
Olmo3 Base 2026.07		20.1
LMK token tuning 2026.07		19.5
Olmo3 512swa 2026.07		19.5
HiLS-Attn HoPE-Q-Cal 2026.07		18.9
HiLS-Attn RoPE-Q-Cal 2026.07		18.9
HiLS-Attn NoPE-Q-Cal 2026.07		17.7