Share your thoughts, 1 month free Claude Pro on usSee more

Offline Reinforcement Learning on D4RL Gym walker2d medium

102.4Normalized Return

RORL

Updated 1mo ago

Evaluation Results

Method	Links
RORL 2022.06		102.4
SPQR 2024.01		98.4
SPQR 2024.01		94.8
EDAC 2021.10		92.5
EDAC 2022.06		92.5
EDAC 2024.01		92.5
PBRL 2022.06		89.6
IPD 2026.03		89.5
GTP 2025.10		89.5
SAC-N 2021.10		87.9
SAC-Min 2024.01		87.9
EDAC-10 2022.06		87.6
QT 2026.03		87.6
QIPO-OT 2025.10		87.6
Repb-SDE 2021.10		85.3
Repb-SDE 2021.10		85.3
QQL 2025.11		85.2
QIPO-Diff 2025.10		85
ROMI-CQL 2021.10		84.3
ROMI-CQL 2021.10		84.3
XQL 2025.11		84.2
SSCQL 2025.10		84.2
CQL 2021.10		83.8
CQL 2021.10		83.8
MXQL 2025.11		83.8
TD3+BC 2025.11		83.7
CQL 2026.03		83
DD 2026.03		82.5
Reinformer 2026.03		80.5
BRAC 2021.10		79.6
CQL 2021.10		79.5
CQL 2022.06		79.5
IQL 2026.03		78.3
IQL 2025.11		78.3
MOREL 2021.10		77.8
COMBO 2021.10		75.5
BC 2025.11		75.3
CQL 2021.10		74.5
CQL-Min 2024.01		74.5
DT 2026.03		74
EDT 2026.03		72.8
CQL 2025.11		72.5
ROMI-BCQ 2021.10		72.4
BCQ 2021.10		71.8
BC 2021.10		70.9
BC 2022.06		70.9
BC 2024.01		70.9
BAIL 2021.10		68.8
QDT 2026.03		67.1
FQL 2025.10		65.9
BEAR 2021.10		59.8
MOREL 2021.10		57
SAC-10 2022.06		46.7
BCQ 2021.10		45.2
BC 2021.10		41.7
BC 2021.10		41.7
UWAC 2021.10		16
REM 2021.10		0.2
BRAC-P 2021.10		0.1
MOPO 2021.10		-0.2
SAC 2021.10		-0.3
BEAR 2021.10		-0.3
BRAC-v 2021.10		-0.3