Share your thoughts, 1 month free Claude Pro on usSee more

Offline-to-Online Reinforcement Learning on hammer-cloned v1

46.74Average Online Expected Return

DUAL

Updated 1mo ago

Evaluation Results

Method	Links
DUAL 2026.05		46.74
Diff-QL 2026.05		33.82
EDIS 2026.05		28
Base 2026.05		27.41
DUAL 2026.05		0.68
EDIS 2026.05		0.35
Diff-QL 2026.05		0.32
Base 2026.05		0.26