AMBIGQA

Benchmarks

Task Name	Dataset Name	SOTA Result
Error Prediction	AmbigQA (val)	PRR69.8	90
Question Answering	AmbigQA	Accuracy (One Intent)69.8	36
Ambiguity Detection	AmbigQA	F1 Score79.5	29
Correctness Detection	Non-AmbigQA	AUROC79.32	20
Question Answering	AmbigQA	Cover EM60	18
Uncertainty Estimation	AmbigQA	AUROC78.5	16
Ambiguous Question Answering	AmbigQA (test)	Accuracy54.43	13
Question Answering	AmbigQA	EM61.3	11
Disambiguation and completeness	AmbigQA	Personalization Bias0.113	9
Question Answering with Clarification	AmbigQA Unambiguous queries (dev)	Reward42.05	8
Question Answering with Clarification	AmbigQA Ambiguous queries (dev)	Reward15.81	8
Question Answering	AmbigQA (test)	Correctness (%)65.8	7
Question Answering	AmbigQA	Accuracy59.8	7
Open-Domain QA	AmbigQA Nq=300	Acc0.473	6
Question Answering	AmbigQA	Helpfulness4.96	5
Question Clarification	AmbigQA High Aleatoric Uncertainty Superset (top 20% examples)	Clarification Rate43.87	4
Question Answering	AmbigQA (sampled)	Accuracy65.5	4
Multi-answer Question Answering	AMBIGQA (test)	F1 (All Questions)46.2	3
Multi-answer Question Answering	AMBIGQA (dev)	F1 (all questions)52.1	3

Showing 19 of 19 rows