Share your thoughts, 1 month free Claude Pro on usSee more

Offline Reinforcement Learning on D4RL Adroit door-human

21.1Mean Normalized Score

QQL

Updated 4d ago

Evaluation Results

Method	Links
QQL 2025.11		21.1
MXQL 2025.11		18.3
IQL 2025.11		13.5
CQL 2025.11		13.3
EPQ 2026.02		13.2
XQL 2025.11		13.2
MoMo 2025.12		11.3
EDAC 2025.12		10.7
CQL 2026.02		9.9
BC 2025.11		9.4
ARMOR 2025.12		6.3
IDQL 2026.02		6
FAC 2026.02		5.5
CAC 2026.02		5
IQL 2025.12		3.3
IQL 2026.02		3.1
SRPO 2026.02		3
BC 2025.12		2.3
MCQ 2026.02		2.3
VIPO 2025.12		2
NEUBAY 2025.12		0
SAC-RND 2026.02		0
ReBRAC 2026.02		0
FQL 2026.02		0
ReBRAC 2025.12		-0.1
TD3+BC 2026.02		-0.1
TD3+BC 2025.11		-0.1
MOPO 2025.12		-0.2
MOBILE 2025.12		-0.2