Share your thoughts, 1 month free Claude Pro on usSee more

Offline Reinforcement Learning on D4RL Medium-Replay HalfCheetah

95.8Normalized Score

Adaptive Policy Selection and Fine-Tuning

Updated 2mo ago

Evaluation Results

Method	Links
Adaptive Policy Selection and Fine-Tuning 2026.05		95.8
Best 2026.05		84.7
OE 2026.05		84.7
PSPO 2026.05		78.4
RAMBO 2025.12		77.6
VIPO 2025.12		77.2
SUMO 2025.12		76.2
FT 2026.05		75.4
RRPI 2026.03		74.4
MoMo 2025.12		72.9
MOPO 2025.12		72.1
NEUBAY 2025.12		72.1
MOBILE 2025.12		71.7
PMDB 2026.03		71.7
PMDB 2023.10		71.7
PMDB 2026.05		71.7
Count-MORL 2023.10		71.5
CROP 2023.10		70.4
MAPLE 2025.12		69.5
RAMBO 2023.10		68.9
RAMBO 2026.03		68.7
RAMBO 2026.05		68.7
OPE 2026.05		68.4
ADMPO 2025.12		67.6
AMG 2026.03		67.6
ADM 2026.05		67.6
MoDAP 2025.12		67.3
CBOP 2025.12		66.4
LEQ 2025.12		65.5
APE-V 2025.12		64.6
EPQ 2026.03		62
EPQ 2026.05		62
EDAC 2025.12		61.3
EDAC 2023.10		61.3
COMBO 2025.12		55.1
COMBO 2025.12		55.1
COMBO 2023.10		55.1
DMG 2026.03		51.4
DMG 2026.05		51.4
ATAC 2023.10		48
CQL 2023.06		45.5
CQL 2026.02		45.5
CQL 2023.06		45.5
CQL 2025.12		45.3
CQL 2026.03		45.3
CQL 2026.05		45.3
IDQL 2025.12		45.1
TD3+BC 2026.02		44.6
IQL 2024.04		44.5
MOReL 2026.03		44.5
MOReL 2026.05		44.5
CABI+TD3-BC 2023.10		44.4
IQL 2023.06		44.2
IQL 2023.10		44.2
Planner 2025.12		44
MPDiffuser+Rank 2025.12		43.5
MPDiffuser 2025.12		43.4
PT 2024.04		42.3
Diffuser 2023.06		42.2
Diffuser 2025.12		42.2
TT 2023.06		41.9
TT 2023.06		41.9
OPRL 2024.04		41.5
Decision Stacks 2023.06		41.1
D-MPC 2025.12		41.1
DC 2026.02		41.1
DMM 2026.02		41.1
TAP 2023.06		40.8
DMamba 2023.06		40.8
CAMP 2024.04		40.5
MOREL 2023.06		40.2
OPPO 2024.04		39.8
DM 2026.02		39.8
DMamba 2023.06		39.6
DD 2023.06		39.4
DD 2023.06		39.3
Decision Diffuser 2025.12		39.3
DT 2026.02		39.1
MambaDM 2023.06		39.1
RATE 2023.06		39
EDT 2026.02		37.8
BC 2023.06		36.6
DT 2023.06		36.6
BC 2025.12		36.6
DT 2025.12		36.6
DT 2023.06		36.6
BC 2024.04		35.7
QLDT 2026.02		35.6
OPPO 2024.04		33.6
DARA 2025.12		28.9
DROCO 2025.12		27.9
BOSA 2025.12		27.8
IQL* 2025.12		26.1
IGDF 2025.12		24.2
CQL* 2025.12		21.3
OTDF 2025.12		19.7
DS4 2026.02		15.2