Share your thoughts, 1 month free Claude Pro on usSee more

Reinforcement Learning on Pendulum PD-C (test)

854Cumulative Reward

SA-DT

Updated 4mo ago

Evaluation Results

Method	Links
SA-DT 2026.03		854
SYMPOL 2026.03		323
SDT 2026.03		310
MLP 2026.03		191
SA-DT 2026.03		-1,251
D-SDT 2026.03		-1,343