Share your thoughts, 1 month free Claude Pro on usSee more

Reinforcement Learning on Spring Pendulum

182.4221Episode Reward

RPO-SAC

Updated 3mo ago

Evaluation Results

Method	Links
RPO-SAC 2023.10		182.4221	0	0	0	0
RPO-DDPG 2023.10		175.1558	0	0	0	0
SAC-L 2023.10		149.6762	0	0.0078	0	0.0837
DDPG-L 2023.10		76.4383	0	0.3805	0	1.0905
CPO 2023.10		15.4687	0	0.7274	0	1.9064
Safety Layer 2023.10		1.1155	6.0975	3.9134	36.9545	25.2101
CUP 2023.10		0.8599	0	9.5898	0	16.3114