Share your thoughts, 1 month free Claude Pro on usSee more

Long Context Understanding on MRCR

75.3Accuracy

Gemini-3.0-pro

Updated 25d ago

Evaluation Results

Method	Links
Gemini-3.0-pro 2026.03		75.3
LongCat-Flash Exp-Chat 2025.12		59.7
Deepseek-v3.1 2026.03		46.62
Qwen3-32B + TableLong 2026.03		42.66
Qwen3-32B 2026.03		42.45
GLM 4.6 2025.12		42.1
Deepseek-R1-Distill-Qwen-32B + TableLong 2026.03		40.57
DeepSeek V3.2 2025.12		37.1
LongCat-Flash Chat 2025.12		34.4
Qwen2.5-32B-Instruct 2026.03		33.19
Qwen2.5-32B-Instruct + TableLong 2026.03		33.19
Deepseek-R1-Distill-Qwen-32B 2026.03		31.94
Deepseek-R1-Distill-Qwen-14B + TableLong 2026.03		30.48
Deepseek-R1-Distill-Qwen-14B 2026.03		29.02
Qwen-Long-L1 2026.03		27.7