SOTA Question Answering Utility Evaluation on Reddit (test) and PapersWithCode

0.8GPT-4 Score

Llama-3.1-8B (FT)

Updated 4mo ago

Evaluation Results

Method	Links
Llama-3.1-8B (FT) 2026.02		0.8	0.79
Llama-3.1-8B (Ngong et al., 2025) 2026.02		0.58	0.48