Share your thoughts, 1 month free Claude Pro on usSee more

Code Generation on HumanEval v1 (test)

86.6Accuracy

PrefillShare

Updated 7d ago

Evaluation Results

Method	Links
PrefillShare 2026.02		86.6	-
Full-FT 2026.02		83.5	-
TIP 2026.05		80.49	-
TA-OPD 2026.05		79.88	-
TA-OPD 2026.05		79.57	-
Entropy 2026.05		79.27	-
Pure OPD 2026.05		78.36	-
TA-OPD+Ent. 2026.05		78.35	-
TA-OPD+Ent. 2026.05		78.05	-
Pure OPD 2026.05		78.05	-
TIP 2026.05		78.05	-
Base 2026.05		77.75	-
Base 2026.05		77.75	-
Entropy 2026.05		77.65	-
Qwen3-8B-Base 2026.02		68.3	-
TA-OPD 2026.05		66.77	-
Base 2026.05		64.63	-
TA-OPD+Ent. 2026.05		62.81	-
TIP 2026.05		62.5	-
Pure OPD 2026.05		62.2	-
TA-OPD+Ent. 2026.05		61.59	-
SFT-GT 2026.05		61.55	-
TA-OPD 2026.05		60.98	-
Base 2026.05		60.97	-
TABOM 2026.05		60.36	-
Entropy 2026.05		59.45	-
Pure OPD 2026.05		59.15	-
TABOM 2026.05		58.54	-
TIP 2026.05		58.54	-
SFT-SD 2026.05		57.92	-
Entropy 2026.05		54.88	-
SFT-SD 2026.05		53.66	-
No-SFT 2026.05		52.66	-
PrefillShare 2026.02		48.8	-
Full-FT 2026.02		48.2	-
SFT-GT 2026.05		46.34	-
LLaMA3.1-8B 2026.02		36.6	-
Teacher 2026.05		-	76.83
Student (No Distill) 2026.05		-	33.54
Hard KD 2026.05		-	35.37
Forward KL 2026.05		-	38.41
Forward KL + Ours 2026.05		-	41.46
Reverse KL 2026.05		-	39.02
Reverse KL + Ours 2026.05		-	37.8
Total Variation 2026.05		-	39.63
Total Variation + Ours 2026.05		-	40.02
Skew FKL 2026.05		-	42.07
Skew FKL + Ours 2026.05		-	42.41
Skew RKL 2026.05		-	42.07
Skew RKL + Ours 2026.05		-	41.24
α-β divergence 2026.05		-	41.46
α-β divergence + Ours 2026.05		-	43.9