Offline Reinforcement Learning on D4RL HalfCheetah Medium v2

77.9Average Normalized Return

RAMBO

Updated 1mo ago

Evaluation Results

Method	Links
RAMBO 2026.05		77.9
PMDB 2026.05		75.6
PhyB 2026.05		74.5
MOPO 2026.02		73.1
ADM 2026.05		72.2
Uncertainty-Aware Rank-One MIMO Q Network 2026.02		68.6
EPQ 2026.05		67.3
EDAC-10 2026.02		64.1
CPED 2023.01		61.8
MOReL 2026.05		60.7
FQL 2026.05		59.9
SPOT 2022.02		58.4
SPOT 2023.01		58.4
PBRL 2026.02		57.9
DMG 2026.05		54.9
Onestep 2022.02		48.4
Onestep RL 2023.01		48.4
TD3+BC 2022.02		48.3
TD3+BC 2023.01		48.3
TD3-BC 2026.02		48.3
IQL 2022.02		47.4
IQL 2023.01		47.4
CQL 2026.02		47
Trajectory Transformer 2021.06		46.9
CQL 2026.05		46.9
BRAC 2021.06		46.3
MBOP 2021.06		44.6
CQL 2021.06		44
Trajectory Transformer 2021.06		44
CQL 2022.02		44
CQL 2023.01		44
GAC 2025.12		43.6
AWAC 2022.02		43.5
AWAC 2023.01		43.5
Behavior Cloning 2021.06		43.1
LPT 2025.12		43.1
BEAR 2026.02		43
TD3+BC 2026.05		42.8
Decision Transformer 2021.06		42.6
BC 2022.02		42.6
DT 2022.02		42.6
BC 2023.01		42.6
DT 2023.01		42.6
GAC 2025.12		42.5
DT 2025.12		42.4
QDT 2025.12		42.4
UWAV 2026.02		42.2
IQL 2026.02		41.7
GAC 2025.12		41.5
GAC 2025.12		41.2
BCQ 2026.02		40.1
IQL 2025.12		8.5
CQL 2025.12		1