Share your thoughts, 1 month free Claude Pro on usSee more

Offline-to-online Reinforcement Learning on relocate

62.8Regret

SMAC

Updated 5mo ago

Evaluation Results

Method	Links
SMAC 2026.02		62.8
SMAC 2026.02		84.9
IQL 2026.02		95.3
IQL 2026.02		95.8
IQL 2026.02		97.4
CalQL/CQL 2026.02		98.1
TD3+BC 2026.02		98.1
TD3+BC 2026.02		98.2
SMAC 2026.02		98.3
CalQL/CQL 2026.02		99
CalQL/CQL 2026.02		99.1
TD3+BC 2026.02		99.2