Share your thoughts, 1 month free Claude Pro on usSee more

Multi-Hop Question Answering on HotpotQA (Helmet correctness score)

1.86Helmet Score

EXTAGENTS

Updated 3mo ago

Evaluation Results

Method	Links
EXTAGENTS 2025.05		1.86
Direct Input 2025.05		1.83
EXTAGENTS (N = 1) 2025.05		1.73
ExtAgents (Ours) 2025.05		1.71
IterDRAG 2025.05		1.7
Direct Input 2025.05		1.56
DRAG 2025.05		1.53
ExtAgents (Ours) 2025.05		1.38
DRAG 2025.05		1.2
IterDRAG 2025.05		1.14
Direct Input 2025.05		0.96