Share your thoughts, 1 month free Claude Pro on usSee more

Offline Reinforcement Learning on D4RL HalfCheetah Med-Expert

105.9Normalized Return

MBOP

Updated 1mo ago

Evaluation Results

Method	Links
MBOP 2023.10		105.9
TT 2023.10		95
TT 2025.09		95
WFDiffuser 2025.09		92.8
CQL 2023.10		91.6
CQL 2025.09		91.6
RGG+ 2023.10		91.2
RGG 2023.10		90.8
Decision Diffuser 2025.09		90.6
DT 2023.10		86.8
DT 2025.09		86.8
IQL 2023.10		86.7
IQL 2025.09		86.7
Diffuser 2023.10		79.8
MOPO 2023.10		63.3
BC 2023.10		55.2
BC 2025.09		55.2
MOREL 2023.10		53.3
MOReL 2025.09		53.3