Share your thoughts, 1 month free Claude Pro on usSee more

Offline-to-online Reinforcement Learning on D4RL Hopper medium discretized

47.9Online Normalized Score

DRIFT

Updated 2mo ago

Evaluation Results

Method	Links
DRIFT 2026.05		47.9	0.1
Cal-QL 2026.05		44.1	28.8
PEX 2026.05		43.1	0.4
CQL 2026.05		35.8	28.8
IQL 2026.05		27.9	0.4
AWAC 2026.05		25.3	26
DQN 2026.05		23.7	0.4
PPO 2026.05		3.1	-
SPA 2026.05		0.4	0.4