Share your thoughts, 1 month free Claude Pro on usSee more

Code Generation on LiveCodeBench v6, HumanEval+, MBPP+, and SciCode

0.992Pass@1

DeepSeek-V3.1

Updated 5mo ago

Evaluation Results

Method	Links
DeepSeek-V3.1 2026.01		0.992
GLM-4.6 2026.01		0.989
DeepSeek-V3.1 2026.01		0.939
A.X K1 2026.01		0.93
A.X K1 2026.01		0.902
A.X K1 2026.01		0.872
DeepSeek-V3.1 2026.01		0.86
GLM-4.6 2026.01		0.86
GLM-4.6 2026.01		0.835
GLM-4.6 2026.01		0.76
A.X K1 2026.01		0.758
A.X K1 2026.01		0.731
DeepSeek-V3.1 2026.01		0.695
DeepSeek-V3.1 2026.01		0.662
GLM-4.6 2026.01		0.559
DeepSeek-V3.1 2026.01		0.391
GLM-4.6 2026.01		0.384
A.X K1 2026.01		0.324