Offline Reinforcement Learning on D4RL Hopper-medium-expert v2

111.8Normalized Return

PMDB

Updated 1mo ago

Evaluation Results

Method	Links
PMDB 2022.10		111.8
PMDB 2022.10		111.8
Uncertainty-Aware Rank-One MIMO Q Network 2026.02		111.6
PBRL 2026.02		110.8
EDAC 2022.10		110.7
EDAC 2022.10		110.7
BCQ 2026.02		110.5
DT 2022.02		107.6
DT 2023.01		107.6
MOREL 2022.10		105.6
MOReL 2022.10		105.6
CQL 2026.02		105.6
CQL 2022.02		105.4
CQL 2023.01		105.4
Onestep 2022.02		103.3
Onestep RL 2023.01		103.3
SPOT 2022.02		99.3
SPOT 2023.01		99.3
TD3+BC 2022.02		98
TD3+BC 2023.01		98
TD3-BC 2026.02		98
CQL 2022.10		96.9
CQL 2022.10		96.9
CPED 2023.01		95.3
IQL 2022.02		91.5
IQL 2023.01		91.5
IQL 2026.02		91.5
RAMBO 2022.10		88.2
BRAC 2022.10		81.3
BRAC 2022.10		81.3
BEAR 2022.10		66.2
BEAR 2022.10		66.2
MOPO 2026.02		60.6
OTDF 2025.12		58.1
EDAC-10 2026.02		58.1
AWAC 2022.02		55.8
AWAC 2023.01		55.8
DROCO 2025.12		54
BC 2022.10		53.9
BC 2022.10		53.9
BC 2022.02		52.5
BC 2023.01		52.5
BEAR 2026.02		50.6
BOSA 2025.12		49.6
UWAV 2026.02		44.9
DARA 2025.12		17
IQL 2025.12		12.5
IGDF 2025.12		11.6
CQL 2025.12		7.8