Share your thoughts, 1 month free Claude Pro on usSee more

Safe RLHF Alignment on PKU-SafeRLHF 30K

6.51Helpfulness

MoCAN

Updated 4mo ago

Evaluation Results

Method	Links
MoCAN 2025.05		6.51	40.13	-1.59
MoCAN 2025.05		6.02	45.13	-0.91
MoCAN 2025.05		5.97	49.75	-0.24
MoCAN 2025.05		5.97	40.5	-1.64
PeCAN 2025.05		5.35	48.38	-0.38
PeCAN 2025.05		0.85	87.88	3.94
PeCAN 2025.05		0.61	90.63	4.33