Share your thoughts, 1 month free Claude Pro on usSee more

Offline Reinforcement Learning on D4RL Medium Hopper

109.4Normalized Score

RRPI

Updated 2mo ago

Evaluation Results

Method	Links
RRPI 2026.03		109.4
PSPO 2026.05		108.5
AMG 2026.03		107.4
ADM 2026.05		107.4
PMDB 2026.03		106.8
PMDB 2023.10		106.8
PMDB 2026.05		106.8
CABI+TD3-BC 2023.10		105
Count-MORL 2023.10		103.6
CROP 2023.10		102.1
EDAC 2023.10		101.6
EPQ 2026.03		101.3
EPQ 2026.05		101.3
DMG 2026.03		100.6
DMG 2026.05		100.6
DMamba 2023.06		98.5
MPDiffuser+Rank 2025.12		98.4
MPDiffuser 2025.12		97.9
Planner 2025.12		97.6
COMBO 2025.12		97.2
COMBO 2023.10		97.2
MOREL 2023.06		95.4
MOReL 2026.03		95.4
RAMBO 2023.10		92.8
DQL 2026.03		90.5
KDP 2026.03		90.3
RAMBO 2026.03		87
RAMBO 2026.05		87
MambaDM 2023.06		85.7
ATAC 2023.10		85.6
MOReL 2026.03		84
MOReL 2026.05		84
DMamba 2023.06		83.5
DD 2023.06		81.2
CAC 2026.03		80.7
DD 2023.06		79.3
Decision Diffuser 2025.12		79.3
RATE 2023.06		77.4
Decision Stacks 2023.06		76.6
Diffuser 2026.03		74.3
CBC 2026.03		71.7
DT 2023.06		67.6
DT 2025.12		67.6
DT 2023.06		67.6
DT 2026.03		67.6
IQL 2023.06		66.3
IQL 2026.03		66.3
IQL 2023.10		66.3
TAP 2023.06		63.4
DT 2023.06		63.1
IDQL 2025.12		63.1
Diffuser 2023.06		62.2
CQL 2026.03		61.9
CQL 2026.05		61.9
D-MPC 2025.12		61.2
TT 2023.06		61.1
TT 2023.06		61.1
TT 2026.03		61.1
CQL 2023.06		58.5
Diffuser 2023.06		58.5
Diffuser 2025.12		58.5
CQL 2026.03		58.5
CQL 2023.06		58
Decision Stacks 2023.06		57.7
TT 2023.06		55.7
BC 2023.06		52.9
BC 2025.12		52.9
BC 2026.03		52.9
MBOP 2026.03		48.8
DD 2023.06		38.1
BC 2023.06		36.4
MOPO 2026.03		28