Share your thoughts, 1 month free Claude Pro on usSee more

Offline Goal-Conditioned Reinforcement Learning on cube-octuple-1B

3,400Success Rate

SHARSA

Updated 4mo ago

Evaluation Results

Method	Links
SHARSA 2025.12		3,400
DQC 2025.12		3,400
HFBC 2025.12		2,800
HIQL 2025.12		2,000
NS 2025.12		900
DQC-naïve 2025.12		300
FBC 2025.12		0
IQL 2025.12		0
OS 2025.12		0
QC 2025.12		0