Share your thoughts, 1 month free Claude Pro on usSee more

Single-Hop Fact-based Reasoning on MAB FC-SH 262K v3 (test)

93Accuracy

Headline pipeline

Updated 1mo ago

Evaluation Results

Method	Links
Headline pipeline 2026.05		93
Headline pipeline 2026.05		82
Ablation A 2026.05		73
LLM-judgment baseline 2026.05		61
GPT-4o (long-context) 2026.05		60
HippoRAG-v2 (best published) 2026.05		54
BM25 2026.05		48
Zep / Graphiti 2026.05		7