Share your thoughts, 1 month free Claude Pro on usSee more

Sycophancy Detection on Sycophancy benchmark (full evaluation set)

0.732AUROC

Hypocrisy Gap

Updated 5mo ago

Evaluation Results

Method	Links
Hypocrisy Gap 2026.01		0.732
Hypocrisy Gap 2026.01		0.731
Hypocrisy Gap 2026.01		0.588
Hypocrisy Gap 2026.01		0.587
Hypocrisy Gap 2026.01		0.549
Hypocrisy Gap 2026.01		0.549
Log-probability baseline 2026.01		0.5
log-probability baseline 2026.01		0.499
log-probability baseline 2026.01		0.453
Log-probability baseline 2026.01		0.452
Log-probability baseline 2026.01		0.424
log-probability baseline 2026.01		0.421