Text Generation on Human Evaluation 6 tasks (10 pairs sampled per task)

0.311Fluency Win Rate

ADS

Updated 4mo ago

Evaluation Results

Method	Links
ADS 2023.05		0.311	0.15	0.539	0.666	0.328	0.172	0.5	0.74	0.267	0.156	0.577	0.817
ADS 2023.05		0.206	0.138	0.656	0.859	0.217	0.128	0.655	0.71	0.278	0.161	0.561	0.878