Share your thoughts, 1 month free Claude Pro on usSee more

Offline Reinforcement Learning on D4RL HalfCheetah Med-Replay v2

52.2Avg Normalized Return

SPOT

Updated 5mo ago

Evaluation Results

Method	Links
SPOT 2022.02		52.2
BRAC 2021.06		47.7
Fu et al. 2021.06		47.7
CQL 2021.06		45.5
CQL 2022.02		45.5
TD3+BC 2022.02		44.6
IQL 2022.02		44.2
Trajectory Transformer 2021.06		44.1
Rev. KL Reg. 2021.06		42.4
MBOP 2021.06		42.3
Trajectory Transformer 2021.06		41.9
AWAC 2022.02		40.5
GAC 2025.12		39.8
LPT 2025.12		39.6
GAC 2025.12		38.8
Exp. Weight 2021.06		38.6
Easy BCQ 2021.06		38.4
Onestep 2022.02		38.1
GAC 2025.12		36.7
Decision Transformer 2021.06		36.6
BC 2022.02		36.6
DT 2022.02		36.6
BC 2021.06		34.9
DT 2025.12		33.3
GAC 2025.12		33
QDT 2025.12		32.8
CQL 2025.12		7.8
IQL 2025.12		5.2
Behavior Cloning 2021.06		4.3