SOTA Spoken Question Answering benchmarks and papers with code

Benchmarks

Dataset Name	SOTA Method	Metric
TriviaQA	VIRBA	Accuracy65.2	26	17d ago
MCIF long track	N2+Avg	BERTScore40.86	20	1mo ago
S-SQuAD (test)	ALBERT-base + DA + KD	EM64.1	16	4mo ago
Spoken-SQuAD	contr-cos-all + asr + giga	EM76.11	15	4mo ago
LibriSQA	+LEAF	BLEU47.33	12	1mo ago
SQuAD v1.1 (test)	AEG (with LFE)	EM89.24	12	4mo ago
MuSiQue v1.0 (test)	AEG (with LFE)	Exact Match (EM)53.99	12	4mo ago
HotpotQA v1.0 (test)	AEG (with LFE)	Exact Match (EM)79.16	12	4mo ago
Web Questions	Fun-Audio-Chat-8B	Accuracy44.59	12	3mo ago
LlamaQ, WebQ, and TriviaQA Aggregate	Lychee-FD	Avg Acc (S->S)46.2	11	17d ago
LibriSQA Part II	Transcripts + Llama 3.1 8B	Accuracy74.9	11	4mo ago
LibriSQA (Part I)	Transcripts + EuroLLM 9B	Accuracy87.6	11	4mo ago
Spoken SQuAD (test)	Transcripts + EuroLLM 9B	Accuracy91.1	11	4mo ago
TriviaQA S→T	Lychee-FD	Accuracy42.5	10	17d ago
WebQ S→T	VITA 1.5	Accuracy41.8	10	17d ago
LlamaQ S→T	VITA 1.5	Accuracy75.7	10	17d ago
UltraEval-Audio WebQ	Qwen3-Omni-30B	S2T Score (Task Correctness)55.95	9	24d ago
UltraEval-Audio TriviaQA		S2T Score76.07	9	24d ago
UltraEval-Audio LLaMA-QA	Qwen3-Omni-30B	S2T Score83	9	24d ago
OpenAudioBench		Accuracy74.82	9	2mo ago
VoiceBench	Raon-Speech	Accuracy76.79	9	2mo ago
UltraEval-Audio S2S		AlpacaEval Score0.7338	9	4mo ago
Spoken SQuAD (B) ASR (test)	Ensembled [(e) plus (d)]	EM60.37	9	4mo ago
SpokenQA	Baichuan-Omni-1.5	LLa. Q. Score78.5	8	1mo ago
KOpenAudioBench	Raon-Speech	Accuracy52.1	8	2mo ago

Showing 25 of 47 rows