Share your thoughts, 1 month free Claude Pro on usSee more

Adversarial Attack Detection on InTheWild

94Recall

Llama Prompt Guard 2

Updated 4mo ago

Evaluation Results

Method	Links
Llama Prompt Guard 2 2025.12		94
IBM Granite Guardian 2025.12		87
Apriel Guard 2025.12		87
Apriel Guard 2025.12		86
Qwen3Guard 2025.12		85
IBM Granite Guardian 2025.12		80
IBM Granite Guardian 2025.12		79
IBM Granite Guardian 2025.12		77
IBM Granite Guardian 2025.12		69
Qwen3Guard 2025.12		67
gpt-oss-safeguard 2025.12		61
Llama Guard 2025.12		43
Llama Guard 2025.12		27
ShieldGemma 2025.12		21
Llama Guard 2025.12		12