Share your thoughts, 1 month free Claude Pro on usSee more

Long-context Question Answering on NarrativeQA Passage Split

32.64Score

Baseline

Updated 2mo ago

Evaluation Results

Method	Links
Baseline 2026.03		32.64
Our + Reorder 2026.03		32.43
No Recompute 2026.03		31.81
Our + Reorder 2026.03		31.8
CacheBlend 2026.03		31.79
EPIC (15%) 2026.03		31.42
Our 2026.03		31.41
EPIC (15%) 2026.03		31.02
Our 2026.03		31
CacheBlend 2026.03		30.95
No Recompute 2026.03		28.1
Our + Reorder 2026.03		23.1
EPIC (15%) 2026.03		22.91
Our 2026.03		22.88
CacheBlend 2026.03		21.97
No Recompute 2026.03		20.78
Baseline 2026.03		18.62
Baseline 2026.03		16.54