Toxicity Classification

Benchmarks

Dataset Name	SOTA Method	Metric
CivilComments sensitive attribute: MUSLIM (test)		Balanced Accuracy59.9	57	4mo ago
Average across WZ, DC, HX, OR		Harmonic F148.8	26	4mo ago
OR		Harmonic F149.7	26	4mo ago
HX		H.-F144.2	26	4mo ago
DC	ToxiGAN	Harmonic Mean F131	26	4mo ago
WZ		Harmonic F173.4	26	4mo ago
ToxCMM	ToxVidLM	F1 Score94.35	24	4mo ago
Toxigen	MAT-STEER	Accuracy60.41	22	4mo ago
ToxiFrench Sbench		Class 0 Precision99	19	3mo ago
ToxiCN (test)	CITD	Accuracy91.47	19	2mo ago
COLD (test)	COLD	Accuracy94.33	19	2mo ago
Toxic	Stage1-SFT-v4	F1 Score72.3	18	17d ago
Personification GPT-3 prompted (test)	V-REx	Loss0.69	16	4mo ago
RealToxicity Prompts GPT-3 prompted (test)	V-REx	Loss0.61	16	4mo ago
CivilComments (CC) (test)	gDRO	Worst-Group Accuracy79.66	13	4mo ago
CivilComments WILDS	Fish	Worst-Group Accuracy75.3	11	3mo ago
CivilComments		Average Accuracy92.6	10	1mo ago
Jigsaw dataset		Rescue Rate44.2	9	1mo ago
Toxicity Dataset (test)	CoGate-LSTM	Test Accuracy96	9	3mo ago
CivilComments Hard subset - demographic identities	Robust Filtered	Hard Accuracy86.9	7	1mo ago
CNTP (test)		Accuracy98.53	7	2mo ago
SCCD (test)	CITD	Accuracy93.73	7	2mo ago
SWSR (test)	CITD	Accuracy91.33	7	2mo ago
DeToxy-B (test)	ToxiAlert	Balanced ACC72.29	6	2mo ago
EEUCA 2026 (val)		Macro F167	6	2mo ago

Showing 25 of 42 rows