Share your thoughts, 1 month free Claude Pro on usSee more

Data Analysis on QRData Verified

63.68Accuracy

Kimi K2 Instruct

Updated 4mo ago

Evaluation Results

Method	Links
Kimi K2 Instruct 2026.01		63.68
GPT-5 2026.01		61.75
Claude Sonnet 4.5 2026.01		61.35
GPT-4o 2026.01		60.24
GPT-5.1 2026.01		60.16
Claude Sonnet 4 2026.01		59.06
GPT-5.1 2026.01		58.96
Deepseek-v3.1 2026.01		57.37
Qwen3-Coder 480B 2026.01		54.72
Qwen3 235B Instruct 2026.01		54.18
GPT-OSS-120B 2026.01		47.95
Qwen3-4B-Instruct 2026.01		45.27
Qwen2.5-7B-Instruct 2026.01		35.04