Share your thoughts, 1 month free Claude Pro on usSee more

Long-context Reasoning on FRAMES

84.7Score

Claude-Opus-4.5

Updated 23d ago

Evaluation Results

Method	Links
Claude-Opus-4.5 2026.06		84.7
Seed2.0 Pro 2026.06		84.5
GPT-5.2 High 2026.06		84
Gemini-3-Flash 2026.06		83.7
DocQA 2026.05		83.5
Seed2.0 Lite 2026.06		83.4
GPT-5-mini 2026.06		82.9
LoongRL 2026.05		81.9
LONGTRACERL 2026.05		81.9
Gemini-3-pro High 2026.06		81.9
LongRLVR 2026.05		81.7
Base 2026.05		80.7
Seed2.0 Mini 2026.06		80.5
LONGTRACERL-GRPO 2026.05		79.6
LONGTRACERL 2026.05		79.5
Claude-Sonnet-4.5 2026.06		78.7
LongRLVR 2026.05		78.5
DocQA 2026.05		78.3
Base 2026.05		76.7
LONGTRACERL-GRPO 2026.05		76.1
LoongRL 2026.05		75.8
LONGTRACERL 2026.05		74.3
DocQA 2026.05		73.4
Base 2026.05		73.2
LONGTRACERL-GRPO 2026.05		73.1
LoongRL 2026.05		72.6
LongRLVR 2026.05		70.3