Share your thoughts, 1 month free Claude Pro on usSee more

Harmful prompt detection on HarmB

100F1 Score

MLPM

Updated 22d ago

Evaluation Results

Method	Links
MLPM 2025.02		100
Qwen3Guard-Gen 2026.07		100
Qwen3Guard-Gen 2026.07		100
MLPM 2025.02		99.58
Abdelnabi et al. 2025.02		99.37
WildGuard 2025.02		99.37
HaloGuard 1.0 2026.07		99.2
MLPM 2025.02		99.16
LlamaGuard3 2025.02		98.94
WildGuard 2026.07		98.9
PolyGuard-Qwen 2026.07		98.7
Qwen3Guard-Gen 2026.07		98.7
HaloGuard 1.0 2026.07		98.7
MLPM 2025.02		98.51
Abdelnabi et al. 2025.02		97.86
LlamaGuard4 2026.07		97.2
Ayub & Majumdar 2025.02		96.98
Ayub & Majumdar 2025.02		96.54
Abdelnabi et al. 2025.02		95.18
Abdelnabi et al. 2025.02		93.3
Ayub & Majumdar 2025.02		90.87
Ayub & Majumdar 2025.02		90.62
GraniteGuardian-3-1-8B 2025.02		79.9
NemoGuard 2026.07		75.2
Aegis-Guard-D 2025.02		70.46
ShieldGemma-9B 2025.02		69.04
ShieldGemma 2026.07		57.3