Share your thoughts, 1 month free Claude Pro on usSee more

POMDP Simulation on Tag

1.7Reward

Perfect

Updated 5mo ago

Evaluation Results

Method	Links
Perfect 2022.09		1.7	-
Naive 2022.09		-1.6	3.7
Scaled Agent 2022.09		-1.8	3.1
Noisy Agent 2022.09		-1.8	3.2
Noisy Agent 2022.09		-2	3.3
Scaled Agent 2022.09		-2.4	3.3
Noisy Agent 2022.09		-2.4	3.6
Scaled Agent 2022.09		-3.6	3.9
Naive 2022.09		-3.8	6.1
Naive 2022.09		-6.8	15.2
Normal 2022.09		-10.7	-