Offline Reinforcement Learning on D4RL hopper-expert v2

118.9Normalized Score

PhyB

Updated 1mo ago

Evaluation Results

Method	Links
PhyB 2026.05		118.9
CEIL 2023.06		113
Decision Mamba 2024.06		112.5
EPQ 2026.05		112.4
TD3+BC 2026.05		112.2
PMDB 2022.10		111.7
PMDB 2022.10		111.7
PMDB 2026.05		111.7
LaMo 2024.06		111.6
DemoDICE 2023.06		111.5
DMG 2026.05		111.5
SMODICE 2023.06		111.3
SMODICE 2023.06		111.2
SMODICE 2023.06		111.1
SMODICE 2023.06		111
UWAV 2026.02		110.5
PBRL 2026.02		110.5
EDAC 2022.10		110.1
EDAC 2022.10		110.1
DT 2024.06		109.6
TD3-BC 2026.02		107.8
Uncertainty-Aware Rank-One MIMO Q Network 2026.02		107.8
BC 2022.10		107.7
BC 2022.10		107.7
DemoDICE 2023.06		107.3
CQL 2022.10		106.5
CQL 2022.10		106.5
CQL 2026.05		106.5
IQL 2026.02		106.2
CEIL 2023.06		106
CEIL 2023.06		105.8
BCQ 2026.02		103.6
CEIL 2023.06		103.3
ADM 2026.05		102.3
ORIL (TD3+BC) 2023.06		97.5
OTDF 2025.12		97
CQL 2026.02		96.5
BOSA 2025.12		94.8
BC 2024.06		90.2
DROCO 2025.12		89.3
MOREL 2022.10		80.4
MOReL 2022.10		80.4
MOReL 2026.05		80.4
BRAC 2022.10		78.1
BRAC 2022.10		78.1
EDAC-10 2026.02		77
IGDF 2025.12		70.1
ValueDICE 2023.06		65.6
ORIL (TD3+BC) 2023.06		64.2
IQL 2025.12		62.6
MOPO 2026.02		62.5
DARA 2025.12		59.1
BEAR 2026.02		54.6
RAMBO 2022.10		50
RAMBO 2026.05		50
CQL 2025.12		47.9
FQL 2026.05		40.5
BEAR 2022.10		39.4
BEAR 2022.10		39.4
IQ-Learn 2023.06		37.3
IQ-Learn 2023.06		25.9
SQIL (TD3+BC) 2023.06		25.5
ORIL (TD3+BC) 2023.06		24.4
ORIL (TD3+BC) 2023.06		22.5
ValueDICE 2023.06		18.6
SQIL (TD3+BC) 2023.06		12.2