Share your thoughts, 1 month free Claude Pro on usSee more

Offline-to-online Reinforcement Learning on D4RL Walker medium discretized

15.9Online Normalised Score

DRIFT

Updated 2mo ago

Evaluation Results

Method	Links
DRIFT 2026.05		15.9	1
IQL 2026.05		13	0.3
CQL 2026.05		12.6	2.5
DQN 2026.05		12.3	1.8
PEX 2026.05		11.8	0.3
Cal-QL 2026.05		11.7	2.5
PPO 2026.05		7.2	-
AWAC 2026.05		5.8	4.2
SPA 2026.05		1.8	1.8