Share your thoughts, 1 month free Claude Pro on usSee more

Code Generation on HumanEval (Accuracy, General Capability Average Accuracy)

35.4Accuracy

Pre-trained

Updated 1mo ago

Evaluation Results

Method	Links
Pre-trained 2026.06		35.4	50.95
AlphaToken 2026.06		33.27	49.51
STM 2026.06		31.66	48.32
ssTOKEN 2026.06		31.16	48.05
XTF 2026.06		30.8	47.3
Token Cleaning 2026.06		30.58	47.94
LESS 2026.06		30.42	47.92
LoRA 2026.06		29.93	47.42
Standard FT 2026.06		28.9	44.2