Share your thoughts, 1 month free Claude Pro on usSee more

Harmful prompt detection on SimpST

100F1 Score

Ayub & Majumdar

Updated 22d ago

Evaluation Results

Method	Links
Ayub & Majumdar 2025.02		100
MLPM 2025.02		100
PolyGuard-Qwen 2026.07		100
HaloGuard 1.0 2026.07		100
HaloGuard 1.0 2026.07		100
MLPM 2025.02		99.5
MLPM 2025.02		99.5
Abdelnabi et al. 2025.02		99.5
LlamaGuard3 2025.02		99.5
GraniteGuardian-3-1-8B 2025.02		99.5
WildGuard 2025.02		99.5
WildGuard 2026.07		99.5
Qwen3Guard-Gen 2026.07		99.5
Qwen3Guard-Gen 2026.07		99.5
Qwen3Guard-Gen 2026.07		99
Abdelnabi et al. 2025.02		98.99
Ayub & Majumdar 2025.02		98.99
NemoGuard 2026.07		98.5
Ayub & Majumdar 2025.02		98.48
Abdelnabi et al. 2025.02		98.48
LlamaGuard4 2026.07		98
Abdelnabi et al. 2025.02		97.96
Aegis-Guard-D 2025.02		97.96
MLPM 2025.02		96.91
Ayub & Majumdar 2025.02		95.29
ShieldGemma-9B 2025.02		91.3
ShieldGemma 2026.07		84.4