Share your thoughts, 1 month free Claude Pro on usSee more

Adversarial Attack Detection on Gandalf

1Recall

Llama Prompt Guard 2

Updated 4mo ago

Evaluation Results

Method	Links
Llama Prompt Guard 2 2025.12		1
Apriel Guard 2025.12		0.91
Apriel Guard 2025.12		0.91
IBM Granite Guardian 2025.12		0.7
Qwen3Guard 2025.12		0.69
gpt-oss-safeguard 2025.12		0.63
IBM Granite Guardian 2025.12		0.52
IBM Granite Guardian 2025.12		0.47
IBM Granite Guardian 2025.12		0.44
IBM Granite Guardian 2025.12		0.41
Llama Guard 2025.12		0.27
Llama Guard 2025.12		0.26
Llama Guard 2025.12		0.23
Qwen3Guard 2025.12		0.02
ShieldGemma 2025.12		0