Share your thoughts, 1 month free Claude Pro on usSee more

Reinforcement Learning on LunarLander (Average Episode Reward)

283.56Average Episode Reward

ESPL

Updated 2mo ago

Evaluation Results

Method	Links
ESPL 2023.11		283.56
SAC 2023.11		276.92
TD3 2023.11		272.13
ACKTR 2023.11		271.53
PPO 2023.11		269.65
DDPG 2023.11		266.05
TRPO 2023.11		265.26
DSP 2023.11		261.36
DTSemNet 2026.05		252.5
Deep RL 2026.05		245
A2C 2023.11		238.51
DGT 2026.05		183.6
VIPER 2026.05		86.73
Regression 2023.11		56.08
ICCT 2026.05		-85