Share your thoughts, 1 month free Claude Pro on usSee more

Preference Alignment on Koala (GPT-4o-mini & RM Evaluators)

77.75Win Rate (Reward Model)

Vanilla Baseline

Updated 2mo ago

Evaluation Results

Method	Links
Vanilla Baseline 2026.05		77.75	71.06	72.45
p-soup & Direct Fine-tuning 2026.05		70.63	47.75	57.31
Direct Prompting 2026.05		52.75	50.31	50.47