malicious-prompts

Benchmarks

Task Name	Dataset Name	SOTA Result
Jailbreak Attack	Malicious Prompts English (test)	ASR@5100	72
Adversarial Attack	16 malicious prompts	ASR0	40
Vulnerability Mitigation	792 malicious prompts MCP vulnerabilities 1.0 (test)	ASR (Trial)0.04	8
Text-to-Image Generation	Malicious Prompts	FID-Censored372.38	6
Malicious Prompt Detection	ahsanayub/malicious-prompts	Accuracy98.72	4

Showing 5 of 5 rows