Share your thoughts, 1 month free Claude Pro on usSee more

Continuous control locomotion on MuJoCo Walker2d v3 (train)

6,482.6Final Return

CGPO(*)

Updated 1mo ago

Evaluation Results

Method	Links
CGPO(*) 2026.05		6,482.6	-	-	-
QVPO 2026.05		5,191.8	-	-	-
DIPO 2026.05		4,917.1	-	-	-
SAC 2026.05		4,888.1	-	-	-
DACER 2026.05		4,381.7	-	-	-
SDAC 2026.05		4,250.8	-	-	-
PPO 2026.05		3,751.5	-	-	-
QSM 2026.05		3,613.4	-	-	-
TD3 2026.05		3,513.9	-	-	-
GePPO 2021.10		3,502	2,199	0.63	21
SPO 2026.05		3,321.8	-	-	-
PPO 2021.10		3,041	1,817	1	-