HateCheck

Benchmarks

Task Name	Dataset Name	SOTA Result	Trend
Hate speech classification	HateCheck (test)	AUC95.6		16
Safety Evaluation	HateCheck	F1 Score87		3

Showing 2 of 2 rows