Share your thoughts, 1 month free Claude Pro on usSee more

Reward Accuracy on Cleaned-PKU-HH-SafeRLHF (test)

91.8Reward Accuracy

Curri-DPO

Updated 1mo ago

Evaluation Results

Method	Links
Curri-DPO 2026.05		91.8
Staged-Competence 2026.05		91.3
Curri-DPO 2026.05		90.4
Standard DPO 2026.05		89.8
Staged-Competence 2026.05		89.6
Sequential 2026.05		89.3
Sqrt-Competence 2026.05		89
Staged-Competence 2026.05		88.2
Sequential 2026.05		87
Standard DPO 2026.05		86.7
Sqrt-Competence 2026.05		86.7
Curri-DPO 2026.05		86.5
Sequential 2026.05		85.7
Standard DPO 2026.05		85.5
Sqrt-Competence 2026.05		84.9