Share your thoughts, 1 month free Claude Pro on usSee more

Harmful prompt detection on TChat

76.51F1 Score

MLPM

Updated 1mo ago

Evaluation Results

Method	Links
MLPM 2025.02		76.51
Aegis-Guard-D 2025.02		75.61
GraniteGuardian-3-1-8B 2025.02		73.25
Abdelnabi et al. 2025.02		72.53
WildGuard 2025.02		70.14
MLPM 2025.02		69.17
Ayub & Majumdar 2025.02		68.9
ShieldGemma-9B 2025.02		68.13
MLPM 2025.02		66.33
Ayub & Majumdar 2025.02		65.63
MLPM 2025.02		64.4
Ayub & Majumdar 2025.02		63.44
Abdelnabi et al. 2025.02		60.94
Abdelnabi et al. 2025.02		59.59
Abdelnabi et al. 2025.02		57.63
Ayub & Majumdar 2025.02		55.62
LlamaGuard3 2025.02		54.11