Share your thoughts, 1 month free Claude Pro on usSee more

Offline Reinforcement Learning on puzzle-3x3-play OGBench 5 tasks v0

87Average Success Rate

Value Flows

Updated 4mo ago

Evaluation Results

Method	Links
Value Flows 2025.10		87
FQL 2025.12		30
FQL 2025.10		30
ReBRAC 2025.10		22
ReBRAC 2025.12		21
MOPO 2025.12		20
MAC 2025.12		20
CODAC 2025.10		20
IFQL 2025.10		19
IQN 2025.10		15
FBRAC 2025.10		14
MOBILE 2025.12		12
IDQL 2025.12		10
LEQ 2025.12		10
IQL 2025.12		9
IQL 2025.10		9
BC 2025.10		2
FMPC 2025.12		1
C51 2025.10		1