Share your thoughts, 1 month free Claude Pro on usSee more

Dialogue Generation on 4 dialogue datasets Aggregate (test val)

12.9Dialogue Avg F1

OPT

Updated 5mo ago

Evaluation Results

Method	Links
OPT 2022.10		12.9
NEO + UL 2022.10		12.5
OPT 2022.10		12.4
NEO + UL 2022.10		11.6
NEO 2022.10		11.5
NEO 2022.10		11.5
NEO + UL+ 2022.10		11.1
OPT 2022.10		10.2
NEO 2022.10		9.4
NEO + UL+ 2022.10		8.5
NEO + UL 2022.10		8
NEO + DPD+ 2022.10		7.3
NEO + DPD+ 2022.10		7.1
NEO + DPD+ 2022.10		6.9
NEO + UL+ 2022.10		2.6