Share your thoughts, 1 month free Claude Pro on usSee more

Offline Reinforcement Learning on D4RL HalfCheetah Med-Expert v2

105.9Avg Normalized Return

MBOP

Updated 5mo ago

Evaluation Results

Method	Links
MBOP 2021.06		105.9
Trajectory Transformer 2021.06		95
Onestep 2022.02		93.4
CQL 2021.06		91.6
CQL 2022.02		91.6
TD3+BC 2022.02		90.7
SPOT 2022.02		86.9
Decision Transformer 2021.06		86.8
DT 2022.02		86.8
IQL 2022.02		86.7
Behavior Cloning 2021.06		59.9
BC 2022.02		55.2
AWAC 2022.02		42.8
BRAC 2021.06		41.9
Trajectory Transformer 2021.06		40.8