Share your thoughts, 1 month free Claude Pro on usSee more

Constitutional AI Alignment on SafeRLHF (test)

4.652Likert Score (5-Point)

Reflect

Updated 1mo ago

Evaluation Results

Method	Links
Reflect 2026.01		4.652	3.45	0.098
Reflect 2026.01		4.628	2.917	0.035
CCBase 2026.01		4.593	4.017	-
CCBase 2026.01		4.554	7.717	-
Reflect 2026.01		4.155	13.26	1.26
CCBase 2026.01		2.895	47.3	-