Share your thoughts, 1 month free Claude Pro on usSee more

Offline Reinforcement Learning on D4RL Adroit door-cloned

24Mean Normalized Score

MOBILE

Updated 4d ago

Evaluation Results

Method	Links
MOBILE 2025.12		24
MOPO 2025.12		15.3
EDAC 2025.12		9.6
IQL 2025.11		9
QQL 2025.11		8.8
MoMo 2025.12		5.8
EPQ 2026.02		5.8
FAC 2026.02		4.1
BC 2025.11		3.4
IQL 2025.12		3.1
FQL 2026.02		2
MXQL 2025.11		1.8
MCQ 2026.02		1.3
ReBRAC 2026.02		1.1
XQL 2025.11		1.1
CAC 2026.02		1
IQL 2026.02		0.8
CQL 2026.02		0.4
SAC-RND 2026.02		0.2
ReBRAC 2025.12		0.1
TD3+BC 2026.02		0.1
NEUBAY 2025.12		0
IDQL 2026.02		0
SRPO 2026.02		0
BC 2025.12		-0.1
ARMOR 2025.12		-0.1
CQL 2025.11		-0.1
TD3+BC 2025.11		-0.2