Share your thoughts, 1 month free Claude Pro on usSee more

LLM Alignment on Anthropic-HH (test)

57.53GPT-4o Win Rate

DPPrefSyn

Updated 1mo ago

Evaluation Results

Method	Links
DPPrefSyn 2026.05		57.53
DPPrefSyn 2026.05		55.95
DPPrefSyn 2026.05		55.08
DPPrefSyn 2026.05		54.9
DP-FT 2026.05		38.72
DP-FT 2026.05		35
DP-FT 2026.05		31.98
DP-FT 2026.05		29.77