Share your thoughts, 1 month free Claude Pro on usSee more

Reinforcement Learning on Pusher

142Average Returns

Multi-task

Updated 2mo ago

Evaluation Results

Method	Links
Multi-task 2020.09		142
HyperCRL 2020.09		99
Coreset 2020.09		87
SI 2020.09		40
DF-CWP-CP 2026.03		39.88
A2C 2026.03		32.41
CG-FPD 2026.03		27.23
PPO 2026.03		25.5
SAC 2026.03		25.5
EWC 2020.09		7
Finetuning 2020.09		0
SMAC 2026.01		-408.2
AC-SGD 2026.01		-433.6
AC-CG 2026.01		-441
AC-Adam 2026.01		-568.3
AC-KFAC 2026.01		-1,086.3