Share your thoughts, 1 month free Claude Pro on usSee more

Offline-to-online Reinforcement Learning on hopper

353Regret

SMAC

Updated 5mo ago

Evaluation Results

Method	Links
SMAC 2026.02		353
SMAC 2026.02		425.5
CalQL/CQL 2026.02		533.7
TD3+BC 2026.02		552.4
IQL 2026.02		958
TD3+BC 2026.02		1,295.4
IQL 2026.02		1,392.6
CalQL/CQL 2026.02		2,469.9