BoLD

Benchmarks

Task Name	Dataset Name	SOTA Result
Detoxification	BOLD	Toxicity (Max)1.9	28
Toxicity Evaluation	BOLD	Toxic Rate0	26
Toxicity Evaluation	BOLD 23679 prompts (test)	Avg Toxicity (Max)0.02	18
Bias and Sentiment Evaluation	BOLD	BOLD Score50.3	17
Emotion Recognition	BoLD	mAP26.66	8
Language Generation Bias Evaluation	BOLD	Toxicity Score (All)0.016	5
Regard Evaluation	BOLD	Gender0.0663	4
Bias Evaluation	BOLD (test)	Bias Score (Gender)0.0502	4
Bias Evaluation	BOLD	Bias Score1.037	4
Emotion Recognition	BoLD official (test)	mR20.1597	3

Showing 10 of 10 rows