Share your thoughts, 1 month free Claude Pro on usSee more

Safety Evaluation on Adolescent AI Safety dataset N=2,052 (test)

0.39Unsafe Rate

Targeted Rewrite

Updated 12d ago

Evaluation Results

Method	Links
Targeted Rewrite 2026.05		0.39	8	3.75	77
Universal Rewrite 2026.05		0.73	15	9.11	187
Original Baseline 2026.05		1.22	25	11.65	239