Share your thoughts, 1 month free Claude Pro on usSee more

Offline Reinforcement Learning on D4RL halfcheetah-random

45.4Normalized Score

ADMPO

Updated 2mo ago

Evaluation Results

Method	Links
ADMPO 2025.12		45.4
AMG 2026.03		45.4
ADM 2026.05		45.4
VIPO 2025.12		42.5
MAPLE 2025.12		41.5
Count-MORL 2023.10		41
RAMBO 2025.12		40
RAMBO 2023.10		40
MoMo 2025.12		39.6
RAMBO 2026.03		39.5
RAMBO 2026.05		39.5
MOBILE 2025.12		39.3
MOREL 2021.10		38.9
MOReL 2026.03		38.9
MOReL 2026.05		38.9
COMBO 2023.10		38.8
COMBO 2021.10		38.8
COMBO 2021.10		38.8
COMBO 2025.12		38.8
COMBO 2023.10		38.8
MOPO 2025.12		38.5
PMDB 2026.03		37.8
PMDB 2023.10		37.8
PMDB 2026.05		37.8
PSPO 2026.05		37.7
Proposed 2023.10		37.6
NEUBAY 2025.12		37
MoDAP 2025.12		36.5
RRPI 2026.03		35.5
CQL 2021.10		35.4
MOPO 2021.10		35.4
Fu et al. 2021.06		35.4
SUMO 2025.12		34.9
CROP 2023.10		33.7
EPQ 2026.03		33
EPQ 2026.05		33
CBOP 2025.12		32.8
Fisher-BRC 2021.06		32.2
CQL 2021.10		31.3
CQL 2025.12		31.3
CQL 2026.03		31.3
CQL 2026.05		31.3
LEQ 2025.12		30.8
APE-V 2025.12		29.9
SAC 2021.10		29.7
Repb-SDE 2021.10		29.1
DMG 2026.03		28.8
DMG 2026.05		28.8
EDAC 2021.10		28.4
EDAC 2025.12		28.4
EDAC 2023.10		28.4
SAC-N 2021.10		28
CQL 2023.10		26.7
TD3+BC 2023.10		26.1
MOREL 2021.10		25.6
BEAR 2023.10		25.1
ROMI-CQL 2021.10		24.5
ROMI-CQL 2021.10		24.5
BRAC 2021.10		24.3
BRAC-p 2021.06		23.5
IQL 2023.10		22.4
CQL 2021.06		21.7
CQL 2021.10		19.6
CQL 2021.10		19.6
CABI+TD3-BC 2023.10		15.1
BEAR 2021.10		12.6
OptiDICE 2023.10		11.6
TD3+BC 2021.06		10.2
TT 2022.06		7.9
BooT-r 2022.06		7.5
Rev. KL Reg. 2021.06		6.9
BooT-r 2022.06		6.9
BooT-o 2022.06		6.7
Easy BCQ 2021.06		5.4
BooT-o 2022.06		4.6
ATAC 2023.10		3.9
ATAC 2023.10		3.9
Exp. Weight 2021.06		3.7
UWAC 2021.10		2.3
ROMI-BCQ 2021.10		2.3
BCQ 2021.10		2.3
BEAR 2021.10		2.3
BCQ 2023.10		2.2
BC 2021.10		2.2
BCQ 2021.10		2.2
BC 2021.10		2.2
BRAC-P 2021.10		2.2
BRAC-v 2021.10		2.2
BAIL 2021.10		2.2
AWAC 2021.06		2.2
BC 2021.06		2.2
BC 2021.06		2
BC 2021.10		-0.1
REM 2021.10		-0.8