Share your thoughts, 1 month free Claude Pro on usSee more

Harmful prompt detection on Combined Average

90.18F1 Score (Combined Average)

MLPM

Updated 1mo ago

Evaluation Results

Method	Links
MLPM 2025.02		90.18
WildGuard 2025.02		88.93
MLPM 2025.02		88.3
MLPM 2025.02		87.55
Abdelnabi et al. 2025.02		87.35
Ayub & Majumdar 2025.02		87.06
MLPM 2025.02		85.95
GraniteGuardian-3-1-8B 2025.02		85.62
Abdelnabi et al. 2025.02		84.51
Abdelnabi et al. 2025.02		84.36
Abdelnabi et al. 2025.02		84.32
Ayub & Majumdar 2025.02		84.31
Ayub & Majumdar 2025.02		82.69
Ayub & Majumdar 2025.02		82.09
LlamaGuard3 2025.02		79.56
Aegis-Guard-D 2025.02		78.82
ShieldGemma-9B 2025.02		73.1