Share your thoughts, 1 month free Claude Pro on usSee more

Multi-hop Question Answering on Bamboogle (Acc, LLM)

45.6Accuracy

AutoAgent

Updated 4mo ago

Evaluation Results

Method	Links
AutoAgent 2026.03		45.6	44.8
Self-Ask 2026.03		33.6	41.6
Standard RAG 2026.03		27.2	32.8
IRCoT 2026.03		27.2	18.4
LongLLMLingua 2026.03		24.8	28.8
SKR 2026.03		24.8	28.8
Naive Generation 2026.03		24	28
Selective-Context 2026.03		24	28.8
Iter-RetGen 2026.03		23.2	25.6
REPLUG 2026.03		22.4	25.6
SuRe 2026.03		16.8	20.8
RECOMP 2026.03		13.6	17.6