Share your thoughts, 1 month free Claude Pro on usSee more

Offline Goal-Conditioned Reinforcement Learning on puzzle 4x5

9,600Success Rate

DQC

Updated 5mo ago

Evaluation Results

Method	Links
DQC 2025.12		9,600
NS 2025.12		9,300
DQC-naïve 2025.12		3,300
IQL 2025.12		2,000
QC 2025.12		2,000
OS 2025.12		1,900
SHARSA 2025.12		100
FBC 2025.12		0
HFBC 2025.12		0
HIQL 2025.12		0