Share your thoughts, 1 month free Claude Pro on usSee more

Semantic Textual Similarity on STS-B (Accuracy/Bias evaluation)

0.595Accuracy

EAR

Updated 3mo ago

Evaluation Results

Method	Links
EAR 2024.06		0.595	0.333
MABEL 2024.06		0.591	0.304
Vanilla-tuning 2024.06		0.578	0.33
MABEL 2024.06		0.57	0.181
Debiased-tuning 2024.06		0.518	0.314
EAR 2024.06		0.509	0.233
Vanilla-tuning 2024.06		0.507	0.197
ProSocialTuning 2024.06		0.494	0.28
Debiased-tuning 2024.06		0.473	0.184
ProSocialTuning 2024.06		0.46	0.169