Share your thoughts, 1 month free Claude Pro on usSee more

Question Answering on NarrativeQA Helmet benchmark

49.5F1 Score

MiA-Emb-8B + MiA-Gen-14B

Updated 4mo ago

Evaluation Results

Method	Links
MiA-Emb-8B + MiA-Gen-14B 2025.12		49.5	29.8
MiA-Emb-8B + MiA-Gen-14B 2025.12		48.7	28.9
GPT4o-2405 2025.12		46.5	-
GPT4o-2408 2025.12		43.1	-
Gemini-1.5-Pro 2025.12		42.8	-
MiA-Emb-8B 2025.12		39.1	20.4
MiA-Emb-8B 2025.12		38.9	21.9
MiA-Emb-8B 2025.12		36.7	18.2
Qwen3-Emb-8B 2025.12		34.8	17.7