Share your thoughts, 1 month free Claude Pro on usSee more

Multi-Hop QA on FictionalHot

6.1Exact Match (EM)

ReSeek

Updated 2mo ago

Evaluation Results

Method	Links
ReSeek 2025.10		6.1
ReSeek 2025.10		5.9
Search-R1 2025.10		3.7
Search-R1 2025.10		3.4
ZeroSearch 2025.10		3.1
ZeroSearch 2025.10		3
Search-o1 2025.10		2
RAG 2025.10		1.2
Search-o1 2025.10		1
RAG 2025.10		0.8
R1 2025.10		0.3
R1 2025.10		0.3
Direct Inference 2025.10		0.1
CoT 2025.10		0.1
Direct Inference 2025.10		0.1
CoT 2025.10		0.1