Share your thoughts, 1 month free Claude Pro on usSee more

CivilComments

Benchmarks

Task Name	Dataset Name	SOTA Result
Toxicity Classification	CivilComments sensitive attribute: MUSLIM (test)	Balanced Accuracy59.9	57
Classification	CivilComments (test)	Average Accuracy92.2	51
Robust Classification	CivilComments	Worst-Group Accuracy72.6	23
Toxicity Detection	CivilComments BERT (test)	Oracle ECE0.57	20
Text Classification	CivilComments (16 groups)	Average Accuracy86.3	20
Toxicity detection	CivilComments-WILDS (test)	Average Accuracy92.7	19
Sentiment Classification	CivilComments HELM	Balanced Acc65.81	18
Text Classification	CivilComments	Worst-Group Accuracy81	17
Toxicity Detection	CivilComments (test)	WGA78.8	14
Text Classification	CivilComments-WILDS (test)	Accuracy92.34	13
Toxicity Classification	CivilComments (CC) (test)	Worst-Group Accuracy79.66	13
Toxicity Classification	CivilComments WILDS	Worst-Group Accuracy75.3	11
Toxicity Classification	CivilComments	Average Accuracy92.6	10
Content Safety	CivilComments (test)	Macro F1-Score65.4	8
Toxicity Classification	CivilComments Hard subset - demographic identities	Hard Accuracy86.9	7
Classification	CivilComments WILDS	Average Accuracy85.5	6
Text Classification	CivilComments (val)	Accuracy69.1	6
Domain Generalization	CivilComments Wilds (test)	Average Accuracy92.2	6
Domain Generalization	CivilComments Wilds (val)	Average Accuracy92.3	6
Calibration	CivilComments BERT (test)	ECE (Oracle Estimate)1.08	5
Text Classification	CivilComments controlled shortcut injection	Accuracy57.2	5
text classification	CivilComments	ECE0.092	4
Bias Reduction	CivilComments group-balanced (evaluation)	Bias Reduction (%)68	3
Accountability Attribution	CivilComments (test)	Stage 1 Score85.76	2

Showing 24 of 24 rows