Share your thoughts, 1 month free Claude Pro on usSee more

Dialogue Evaluation on Ice-breaker human evaluation 1.0 (test)

0.552Overall Score

Model A

Updated 4mo ago

Evaluation Results

Method	Links
Model A 2022.03		0.552	0.565	0.527	0.873	1.018	1.011	-0.287	0.156
Model A 2022.03		0.422	0.589	0.56	0.518	0.718	0.527	0.009	0.034
Model B 2022.03		0.376	0.379	0.34	0.634	0.769	0.82	-0.221	-0.087
Model C 2022.03		0.322	0.615	0.537	0.19	0.631	0.061	-0.344	0.565
Model B 2022.03		0.273	0.406	0.34	0.414	0.633	0.423	-0.369	0.063
Model C 2022.03		0.222	0.402	0.337	0.089	0.654	-0.068	-0.376	0.514
Model D 2022.03		-0.139	-0.277	-0.204	0.123	0.349	0.295	-0.638	0.62
Model E 2022.03		-0.198	-0.172	-0.203	-0.054	0.316	-0.343	-0.533	-0.396
Model E 2022.03		-0.24	-0.125	-0.161	-0.196	0.318	-0.393	-0.631	-0.489
Model D 2022.03		-0.267	-0.426	-0.402	-0.011	0.234	0	-0.628	-0.636