Share your thoughts, 1 month free Claude Pro on usSee more

Offline-to-online Reinforcement Learning on pen

5.3Regret

SMAC

Updated 5mo ago

Evaluation Results

Method	Links
SMAC 2026.02		5.3
SMAC 2026.02		7.7
CalQL/CQL 2026.02		8
IQL 2026.02		10.3
SMAC 2026.02		13.3
IQL 2026.02		16.1
CalQL/CQL 2026.02		17.8
IQL 2026.02		18
CalQL/CQL 2026.02		28.8
TD3+BC 2026.02		31.8
TD3+BC 2026.02		32.9
TD3+BC 2026.02		55.2