Share your thoughts, 1 month free Claude Pro on usSee more
WorkDL logo mark

Jailbreak Attack Evaluation on SafeBench 100 sampled harmful queries

97ASR

StructBreak

15.8836.945879.06May 25, 2026
Updated 8d ago

Evaluation Results

MethodLinks
2026.05
97
2026.05
97
2026.05
95
2026.05
95
2026.05
93
2026.05
92
2026.05
92
2026.05
92
2026.05
90
2026.05
88
2026.05
88
2026.05
85
2026.05
82
2026.05
77
2026.05
77
2026.05
76
2026.05
70
2026.05
70
2026.05
70
2026.05
61.2
2026.05
61
2026.05
60
2026.05
57
2026.05
55
2026.05
53.8
2026.05
53
2026.05
51.7
2026.05
49
2026.05
46
2026.05
45
2026.05
45
2026.05
43
2026.05
42
2026.05
42
2026.05
41
2026.05
38
2026.05
38
2026.05
38
2026.05
33
2026.05
33
2026.05
31
2026.05
30
2026.05
29
2026.05
29
2026.05
29
2026.05
27.7
2026.05
26
2026.05
19