Share your thoughts, 1 month free Claude Pro on usSee more

Audio Question Answering on AudioCaps-QA (test)

60.77Model-as-Judge Score

M3KG-RAG

Updated 4mo ago

Evaluation Results

Method	Links
M3KG-RAG 2025.12		60.77
M3KG-RAG 2025.12		53.23
VAT-KG 2025.12		51.3
Wikidata 2025.12		49.78
M2ConceptBase 2025.12		49.78
None 2025.12		49
VTKG 2025.12		48.95
VAT-KG 2025.12		44.6
Wikidata 2025.12		43.58
None 2025.12		43.13
VTKG 2025.12		43.02
M2ConceptBase 2025.12		42.19