Share your thoughts, 1 month free Claude Pro on usSee more

Reinforcement Learning on LunarLander (LL) (test)

241Average Undiscounted Reward

MLP

Updated 4mo ago

Evaluation Results

Method	Links
MLP 2026.03		241
SYMPOL 2026.03		57
SDT 2026.03		-124
SA-DT 2026.03		-150
SA-DT 2026.03		-197
D-SDT 2026.03		-221