Share your thoughts, 1 month free Claude Pro on usSee more

Code Generation on HumanEval (Score %)

57.3Score (%)

Qwen3-4B

Updated 2d ago

Evaluation Results

Method	Links
Qwen3-4B 2026.05		57.3
Qwen2.5-7B 2026.05		55.5
Qwen3.5-4B 2026.05		50
OLMo-3-7B 2026.05		45.1
Mellum 2 2026.05		41.5