Malicious Prompt Detection on LLM-LAT/harmful-dataset

92.1Accuracy

Enhanced Filtering and Summarization System

Updated 4mo ago

Evaluation Results

Method	Links
Enhanced Filtering and Summarization System 2025.05		92.1
Logistic Regression 2025.05		12.31
Toxic-BERT 2025.05		2.57
Hate Speech Detector 2025.05		0.81