Share your thoughts, 1 month free Claude Pro on usSee more

Input Moderation on Harmful safety datasets Average

88.33Average F1 Score (Input Moderation)

MLPM

Updated 1mo ago

Evaluation Results

Method	Links
MLPM 2025.02		88.33
Ayub & Majumdar 2025.02		87.54
MLPM 2025.02		87.52
MLPM 2025.02		87.5
Abdelnabi et al. 2025.02		86.82
Abdelnabi et al. 2025.02		86.7
Ayub & Majumdar 2025.02		86.42
Ayub & Majumdar 2025.02		86.4
Abdelnabi et al. 2025.02		86.07