Share your thoughts, 1 month free Claude Pro on usSee more

Hallucination Detection on WebQuestions

87.67AUROC

DRIFT

Updated 4mo ago

Evaluation Results

Method	Links
DRIFT 2026.01		87.67
DRIFT 2026.01		84.01
DRIFT 2026.01		83.11
DRIFT 2026.01		82.76
DRIFT 2026.01		80.79
Semantic Entropy 2026.01		80.71
HaloScope 2026.01		80.43
Semantic Entropy 2026.01		80.12
DRIFT 2026.01		79.63
HaloScope 2026.01		78.56
HaloScope 2026.01		77.03
Semantic Entropy 2026.01		76.76
HaloScope 2026.01		76.7
HaloScope 2026.01		75.72
HaloScope 2026.01		72.62