Share your thoughts, 1 month free Claude Pro on usSee more

Data Analysis on DAEval Verified

92.82Accuracy

Kimi K2 Instruct

Updated 4mo ago

Evaluation Results

Method	Links
Kimi K2 Instruct 2026.01		92.82
GPT-4o 2026.01		92.26
Claude Sonnet 4.5 2026.01		91.71
Claude Sonnet 4 2026.01		90.91
Qwen3-Coder 480B 2026.01		90.61
GPT-5.1 2026.01		89.5
GPT-5 2026.01		89.5
GPT-5.1 2026.01		87.85
Qwen3 235B Instruct 2026.01		85.08
GPT-OSS-120B 2026.01		84.53
Deepseek-v3.1 2026.01		82.32
Qwen3-4B-Instruct 2026.01		64.47
Qwen2.5-7B-Instruct 2026.01		50.56