Share your thoughts, 1 month free Claude Pro on usSee more

Offline Reinforcement Learning on D4RL HalfCheetah Med-Replay

72.1Normalized Avg Return

MOPO

Updated 1mo ago

Evaluation Results

Method	Links
MOPO 2024.11		72.1
MOBILE 2024.11		71.7
MOPO 2024.11		66.3
MOBILE 2024.11		63.7
C-LAP 2024.11		55.5
MOPO 2023.10		53.1
FQL+BC 2025.09		46.23
CQL 2023.10		45.5
CQL 2025.09		45.5
IQL 2023.10		44.2
IQL 2025.09		44.2
PLAS 2024.11		43.9
IQL 2025.09		43.44
MBOP 2023.10		42.3
Diffuser 2023.10		42.2
TT 2023.10		41.9
TT 2025.09		41.9
PLAS 2024.11		41.8
RGG+ 2023.10		41.3
RGG 2023.10		41
MOREL 2023.10		40.2
MOReL 2025.09		40.2
Decision Diffuser 2025.09		39.3
WFDiffuser 2025.09		38.1
Aaren 2024.05		37.91
BC 2023.10		36.6
DT 2023.10		36.6
BC 2025.09		36.6
DT 2025.09		36.6
Transformer 2024.05		36.57