Share your thoughts, 1 month free Claude Pro on usSee more
WorkDL logo mark

Safety Evaluation on AdvBench (Harmfulness Rate by Step)

0Reasoning Harmfulness Rate

RealSafe-R1

-1.69.22030.8Aug 6, 2025
Updated 27d ago

Evaluation Results

MethodLinks
2025.08
00-
2025.08
02-
2025.08
00-
2025.08
02-
2025.08
00-
2025.08
040-
2025.08
00-
2025.08
00-
2025.08
00-
2025.08
1.021-
2025.08
1.081.28-
2025.08
1.11-
2025.08
1.121.02-
2025.08
1.141-
2025.08
1.141-
2025.08
1.181.08-
2025.08
1.21.04-
2025.08
1.221-
2025.08
1.221-
2025.08
1.241-
2025.08
1.241.03-
2025.08
1.31.12-
2025.08
1.321.02-
2025.08
1.331-
2025.08
1.361.12-
2025.08
1.391.07-
2025.08
1.41.02-
2025.08
1.471.29-
2025.08
1.481.14-
2025.08
1.51-
2025.08
1.531.13-
2025.08
1.581.08-
2025.08
1.661-
2025.08
1.711.22-
2025.08
22-
2025.08
24-
2025.08
2.021.46-
2025.08
2.281.3-
2025.08
2.321.5-
2025.08
66-
2025.08
62-
2025.08
126-
2025.08
1414-
2025.08
2622-
2025.08
2824-
2025.08
3020-
2025.08
3028-
2025.08
3840-
2025.08
4032-
2025.08
4040-
2025.08
--42
2025.08
--0
2025.08
--0
2025.08
--20
2025.08
--2
2025.08
--18
2025.08
--0
2025.08
--4
2025.08
--0
2025.08
--22
2025.08
--0
2025.08
--14
2025.08
--0
2025.08
--10
2025.08
--0
2025.08
--2
2025.08
--0