Share your thoughts, 1 month free Claude Pro on usSee more

Preference Alignment on UltraFeedback (RM and GPT-4o-mini Evaluators)

71.25Win Rate (RM Evaluator)

Vanilla Baseline

Updated 2mo ago

Evaluation Results

Method	Links
Vanilla Baseline 2026.05		71.25	69.75	72.45
p-soup & Direct Fine-tuning 2026.05		65.5	45.37	57.31
Direct Prompting 2026.05		48.44	50.38	50.47