Share your thoughts, 1 month free Claude Pro on usSee more

Long-context Question Answering on 2WikiMQA (Passage Split)

52.53Score

Baseline

Updated 2mo ago

Evaluation Results

Method	Links
Baseline 2026.03		52.53
Baseline 2026.03		51.61
Our + Reorder 2026.03		50.58
Our 2026.03		50.19
Our 2026.03		48.9
Our + Reorder 2026.03		46.66
Baseline 2026.03		45.88
EPIC (15%) 2026.03		45.21
Our + Reorder 2026.03		44.17
CacheBlend 2026.03		43.3
Our 2026.03		42.08
CacheBlend 2026.03		39.76
EPIC (15%) 2026.03		38.85
CacheBlend 2026.03		37.57
EPIC (15%) 2026.03		36.97
No Recompute 2026.03		35.23
No Recompute 2026.03		30.66
No Recompute 2026.03		11.62