Share your thoughts, 1 month free Claude Pro on usSee more

Offline Goal-Conditioned Reinforcement Learning on puzzle 3x3 play v0

100Success Rate

IQL

Updated 2mo ago

Evaluation Results

Method	Links
IQL 2026.05		100
GCIQL 2026.04		95
ARLi 2026.05		86
HSVL 2026.04		54
ARLe 2026.05		44
HIQL1vr 2026.05		27
HIQL2vr 2026.05		24
HIQL 2026.04		12
GCIVL 2026.04		6
CRL 2026.04		3
GCBC 2026.04		2
QRL 2026.04		1
HIQL2v 2026.05		0