Share your thoughts, 1 month free Claude Pro on usSee more

Offline Reinforcement Learning for Dialogue Management on Reddit Casual

4.65Return

SAIQL

Updated 5mo ago

Evaluation Results

Method	Links
SAIQL 2023.02		4.65
FtLE 2023.02		4.59
MoE-VRL 2023.02		4.46
EXP 1* 2023.02		4.25
FtLE 2023.02		1.14
EXP 1* 2023.02		0.97
SAIQL 2023.02		0.81
MoE-VRL 2023.02		0.72