Share your thoughts, 1 month free Claude Pro on usSee more

Harmful prompt detection on WGMix

88.52F1 Score

MLPM

Updated 1mo ago

Evaluation Results

Method	Links
MLPM 2025.02		88.52
Ayub & Majumdar 2025.02		88.09
MLPM 2025.02		88.04
WildGuard 2025.02		88.04
MLPM 2025.02		87.63
Abdelnabi et al. 2025.02		86.27
MLPM 2025.02		86.21
Abdelnabi et al. 2025.02		86.2
Abdelnabi et al. 2025.02		85.73
Abdelnabi et al. 2025.02		85.18
GraniteGuardian-3-1-8B 2025.02		84.57
Ayub & Majumdar 2025.02		83.31
Ayub & Majumdar 2025.02		80.91
Ayub & Majumdar 2025.02		80.64
LlamaGuard3 2025.02		76.76
Aegis-Guard-D 2025.02		72.09
ShieldGemma-9B 2025.02		58.88