Malicious Prompt Detection on codesagar/malicious-llm-prompts v3

87.89Accuracy (%)

Enhanced Filtering and Summarization System

Updated 4mo ago

Evaluation Results

Method	Links
Enhanced Filtering and Summarization System 2025.05		87.89
Logistic Regression 2025.05		85.37
Toxic-BERT 2025.05		4.1
Hate Speech Detector 2025.05		2.05