Share your thoughts, 1 month free Claude Pro on usSee more

Harmful Content Safety on HarmBench

98.4Evaluation Score (avg@4)

Self-ReSET

Updated 2mo ago

Evaluation Results

Method	Links
Self-ReSET 2026.05		98.4
STAR-1 2026.05		98.3
Self-ReSET 2026.05		98.1
RECAP 2026.05		97.8
DAPO 2026.05		97.3
STAR-1 2026.05		95
STAR-1 2026.05		92.4
DAPO 2026.05		89
RECAP 2026.05		86.9
DAPO 2026.05		86.1
Self-ReSET 2026.05		85.1
RECAP 2026.05		84.7
Safechain 2026.05		66.6
Base 2026.05		63.3
Safechain 2026.05		50.1
Safechain 2026.05		39.2
Base 2026.05		30.1
Base 2026.05		23.4