Share your thoughts, 1 month free Claude Pro on usSee more

Continual Reinforcement Learning on Atari Two-cycle (train)

0.722C1 Forward Score

DV3

Updated 1mo ago

Evaluation Results

Method	Links
DV3 2026.03		0.722	0.378	0.735	-0.514	-0.75	0.61	0.9	-0.393	-0.299
TES-SAC 2026.03		0.194	0.112	0.089	-0.898	-0.882	0.767	4.4	-0.203	-0.168
ARROW 2026.03		-0.036	0.03	0.012	-0.554	0.309	1.418	79.6	0.442	0.388