Share your thoughts, 1 month free Claude Pro on usSee more

Jailbreaking on AdvBench (Classifier-Specific ASR@1)

0ASR@1 (No Refusal)

ADV-LLM

Updated 5mo ago

Evaluation Results

Method	Links
ADV-LLM 2026.02		0	0.4	0.8
Jigsaw Puzzle 2026.02		10	0.8	3.7
Jailbreak-R1 2026.02		13.9	2.9	9.8
FITD 2026.02		21.5	3.5	7.5
FlipAttack 2026.02		31	3.7	24.8
GOAT 2026.02		36.2	5.4	5.6
CoA 2026.02		42.1	1.9	6.4
X-Teaming 2026.02		45.6	15	30.2
Crescendo 2026.02		58.5	21.2	40.2
SEMA 2026.02		62.7	36	57.7
ActorAttack 2026.02		88.3	6.5	19.2