Share your thoughts, 1 month free Claude Pro on usSee more

Stereotyping Evaluation on DialogSum

5.6Stereotype Fraction

GPT-4o-mini

Updated 2mo ago

Evaluation Results

Method	Links
GPT-4o-mini 2024.07		5.6	0.543	30.9
Gemini-Flash-Lite 2024.07		7.2	0.504	30
Gemini-Flash 2024.07		8.3	0.413	29
GPT-4o 2024.07		8.9	0.559	29.6
Gemini-Pro 2024.07		8.9	0.496	30.5