Share your thoughts, 1 month free Claude Pro on usSee more

Safety Evaluation on Manual Evaluation Safety Dataset

3.83Average Safety Score

M_Self-MOA

Updated 4mo ago

Evaluation Results

Method	Links
M_Self-MOA 2026.03		3.83
M_PKU-RLHF 2026.03		3.8
M_Self-MOA 2026.03		3.67
M_PKU-RLHF 2026.03		3.67
M_PKU-RLHF 2026.03		3.37
M_Self-MOA 2026.03		3.3
M_Self-MOA 2026.03		3.2
M_base 2026.03		2.97
M_base 2026.03		2.77
M_base 2026.03		2.43
M_PKU-RLHF 2026.03		2.13
M_base 2026.03		2.1