LongReason

Benchmarks

Task Name	Dataset Name	SOTA Result
Long-context Reasoning	LongReason Average across 16k-64k	Accuracy54.2	36
Long-context Reasoning	LongReason 64k prefill length	Accuracy53.02	36
Long-context Reasoning	LongReason 32k prefill length	Accuracy53.9	36
Long-context Reasoning	LongReason 16k prefill length 1.0 (test)	Accuracy55.67	36
Long-context reasoning	LongReason 64K-input 70K context	Accuracy71.25	34
Long-context reasoning	LongReason	Accuracy (32K Context)86.6	21
Long-context reasoning	LongReason	Score86.9	18
Multi-choice reasoning	LongReason	Accuracy (32k)84.13	17
Question Answering	LongReason	Acc72.3	15
Synthetic Long-context Reasoning	LongReason	Accuracy84.89	12
RL Training	LongReason	Peak Memory (GB)80	6
Reasoning	LongReason (val)	Accuracy (val)79.3	4

Showing 12 of 12 rows