Share your thoughts, 1 month free Claude Pro on usSee more

Offline-to-Online Reinforcement Learning on door-cloned v1

15.26Average Online Return

DUAL

Updated 1mo ago

Evaluation Results

Method	Links
DUAL 2026.05		15.26
Diff-QL 2026.05		11.55
EDIS 2026.05		10.46
Base 2026.05		9.79
DUAL 2026.05		-0.28
Diff-QL 2026.05		-0.31
EDIS 2026.05		-0.32
Base 2026.05		-0.33