Share your thoughts, 1 month free Claude Pro on usSee more

Offline-to-online Reinforcement Learning on D4RL Cheetah expert discretized

9.7Online Normalized Score

DRIFT

Updated 2mo ago

Evaluation Results

Method	Links
DRIFT 2026.05		9.7	0.5
CQL 2026.05		8.6	0.7
Cal-QL 2026.05		8.5	0.7
PEX 2026.05		7.7	0.2
IQL 2026.05		6.8	0.2
PPO 2026.05		5.9	-
DQN 2026.05		4.7	0.1
AWAC 2026.05		1	1.1
SPA 2026.05		0.1	0.1