BioASQ

Benchmarks

Task Name	Dataset Name	SOTA Result
Hallucination Detection	BioASQ	AUROC81.13	104
Question Answering	BioASQ	Accuracy98.32	72
Medical Question Answering	BioASQ	Accuracy88.67	63
Selective Prediction	BioASQ	E-AURC0.2744	28
Question Answering	BioASQ (dev)	F1 Score77.8	28
Biomedical reasoning	BioASQ out-of-domain	Accuracy91.87	25
Hallucination Detection	BioASQ (test)	AUROC77.51	20
Reliability Estimation	BioASQ	AUROC70.46	20
Domain Adaptation	BioASQ (test)	BBH54.89	20
Biomedical Multi-hop Question Answering	BioASQ-B	EM40.6	18
Extractive Question Answering	BioASQ (test)	EM47.27	16
Snippet Retrieval	BIOASQ 7 (test batches 1-5)	MAP0.2518	16
Document Retrieval	BIOASQ 7 (test batches 1-5)	MAP19.24	16
Question Answering	BioASQ MRQA out-of-domain evaluation 2019 (test)	EM60.3	15
Question Answering	BioASQ	EM45.68	14
Question Answering	BioASQ	T Score66	14
Reading Comprehension	BioASQ MRQA out-of-domain	EM67.62	14
Question Answering	BioASQ factoid 7b (test)	SAcc47.4	13
Hallucination Detection	BioASQ	Inference Throughput (Samples/sec)5,351	12
Extractive Question Answering	BioASQ MRQA	F1 Score91	12
Biomedical Question Answering	BioASQ	Factoid Acc29	11
Question Answering	BioASQ	F1 Score26.1	10
Question Answering	BioASQ	SAME_CONCLUSION Score85.71	10
Retrieval	BioASQ (test)	Top-2046	9
Biomedical Question Answering	BioASQ (test)	ROUGE54.8	8

Showing 25 of 61 rows