Share your thoughts, 1 month free Claude Pro on usSee more

Code Generation on HumanEval Llama-3-70B (test)

26.3QD-Score

QD-LLM

Updated 22d ago

Evaluation Results

Method	Links
QD-LLM 2026.05		26.3	26.2	41	94
CMA-ME (ad.) 2026.05		19.8	19.7	30	-
QDAIF 2026.05		18.6	18.5	28	-
EvoPrompt 2026.05		17.2	17.1	21	-
Best-of-N+MMR 2026.05		16.4	16.3	24	-
Diverse Beam 2026.05		15.1	15	21	-
Nucleus Samp. 2026.05		14.2	14.1	19	-
Vanilla ME 2026.05		13.8	13.7	18	-