Share your thoughts, 1 month free Claude Pro on usSee more

Jailbreak Safety Evaluation on English dataset Multi-Image

14StrongREJECT (Perturbed)

GPT-4o

Updated 4mo ago

Evaluation Results

Method	Links
GPT-4o 2025.04		14	13	20
Claude 3.5 Sonnet 2025.04		10	9	0
Gemini 1.5 Flash 2025.04		8	8	32
Gemini 1.5 Pro 2025.04		8	7	8
Claude 3 Haiku 2025.04		7	8	9
GPT-4o Mini 2025.04		1	1	20