Share your thoughts, 1 month free Claude Pro on usSee more

Long Context Evaluation on Humanity's Last Exam AA-LCR

54.3Accuracy

GLM-4.6

Updated 3mo ago

Evaluation Results

Method	Links
GLM-4.6 2026.01		54.3
DeepSeek-V3.1 2026.01		53.3
A.X K1 2026.01		36
GLM-4.6 2026.01		13.3
DeepSeek-V3.1 2026.01		13
A.X K1 2026.01		8.6