MultiHopRAG

Benchmarks

Task Name	Dataset Name	SOTA Result
LLM Serving and Question Answering	MultiHopRAG hot0.7 (test)	KV-Cache Hit Rate49.27	40
End-to-end Question Answering	MultiHopRAG (test val)	Accuracy47.14	20
Multi-session Retrieval-Augmented Generation	MultihopRAG (test)	F1 Score64.4	12
Multi-hop Reasoning	MultiHopRAG	EM89.6	11
Information Retrieval	MultiHopRAG (test)	MRR@1063.58	11
Query-relevant Extraction	MultiHopRAG	F1 Score32	8
Main Content Extraction	MultiHopRAG	F1 Score87.4	8
Multi-hop Reasoning	MultiHopRAG Average 1.0 (test)	Relevancy64.47	4
Multi-hop Reasoning	MultiHopRAG Temporal 1.0 (test)	Relevancy39.38	4
Multi-hop Reasoning	MultiHopRAG Comparison 1.0 (test)	Relevancy60.28	4
Multi-hop Reasoning	MultiHopRAG Inference 1.0 (test)	Relevancy96.76	4

Showing 11 of 11 rows