2Wiki

Benchmarks

Task Name	Dataset Name	SOTA Result
Question Answering	2WIKI	EM86	260
Multi-hop Question Answering	2Wiki	Exact Match74.9	215
Question Answering	2Wiki (test)	EM Accuracy61.8	59
Class-level Continual Learning	2Wiki	Average Accuracy (AA)71.74	56
Multi-Hop Question Answering	2Wiki	Accuracy (2Wiki)43.6	44
Multi-hop QA	2Wiki	EM62	42
Retrieval	2Wiki	Recall@596.13	42
Multi-hop Question Answering	2Wiki (test)	F1 Score69.7	34
Multi-hop QA Retrieval	2Wiki	Recall@290.1	32
Adversarial Attack	2Wiki	ASR78.8	30
Multi-Hop Question Answering	2Wiki (out-of-domain)	Accuracy47.6	28
Question Answering	2Wiki 100K context	Accuracy78.91	25
Multi-Hop Question Answering	2Wiki (test)	Accuracy45.1	24
Multi-Hop Search-augmented Question Answering	2Wiki	Success Rate45.2	22
Multi-hop Question Answering	2Wiki 18	Exact Match (EM)43.6	20
Multi-Hop Question Answering	2Wiki	Token-Level F158.7	20
Question Answering	2Wiki 30K context	Accuracy73.7	19
Question Answering	2Wiki 10K context	Accuracy72.2	19
Multi-hop Question Answering	2Wiki	pass@158	18
Multi-Hop Question Answering	2Wiki	Exact Match (EM)46.9	18
Multi-Hop Question Answering	2wiki	F1 Score61.3	17
Multi-Hop QA	2Wiki	Accuracy70.5	17
Multi-hop Question Answering	2Wiki	MBE59	17
Multi-hop Question Answering	2Wiki	EM48.89	16
Multi-Hop QA Verification	2wiki	P@181.21	16

Showing 25 of 80 rows