Public Prompt Harmfulness Benchmarks

Benchmarks

Task Name	Dataset Name	SOTA Result	Trend
Prompt Harmfulness Classification	Public Prompt Harmfulness Benchmarks (ToxicChat, OpenAI Moderation, AegisSafetyTest, SimpleSafetyTests, HarmBenchPrompt)	OAI Score81		26

Showing 1 of 1 rows