Malicious Prompt Detection on Weighted Average Across All Datasets

98.71Accuracy

Enhanced Filtering and Summarization System

Updated 4mo ago

Evaluation Results

Method	Links
Enhanced Filtering and Summarization System 2025.05		98.71
Logistic Regression 2025.05		90.42
Toxic-BERT 2025.05		4.41
Hate Speech Detector 2025.05		1.79