Share your thoughts, 1 month free Claude Pro on usSee more

Offline Reinforcement Learning on D4RL Gym walker2d (medium-replay)

109.7Normalized Return

ROMI-CQL

Updated 1mo ago

Evaluation Results

Method	Links
ROMI-CQL 2021.10		109.7
ROMI-CQL 2021.10		109.7
IPD 2026.03		96.2
QT 2026.03		94.2
GTP 2025.10		94.2
EDAC-10 2022.06		94
TT(+Q) 2023.10		90.6
RORL 2022.06		90.4
QQL 2025.11		90.2
QIPO-Diff 2025.10		90.1
SAC-10 2022.06		89.6
SPQR 2024.01		89.6
CQL 2021.10		88.4
TT 2023.10		88.3
CQL 2021.10		88.2
SPQR 2024.01		87.8
EDAC 2021.10		87.1
EDAC 2022.06		87.1
EDAC 2024.01		87.1
SSCQL 2025.10		85.9
TT(+Q) 2023.10		84.6
Repb-SDE 2021.10		83.8
Repb-SDE 2021.10		83.8
MXQL 2025.11		83.6
TT 2023.10		82.6
XQL 2025.11		82.2
TD3(+BC) 2023.10		81.8
TD3+BC 2025.11		81.8
DT 2026.03		79.4
SAC-N 2021.10		78.7
SAC-Min 2024.01		78.7
QIPO-OT 2025.10		78.6
PBRL 2022.06		77.7
CQL 2023.10		77.2
CQL 2026.03		77.2
CQL 2025.11		77.2
CQL 2021.10		76.8
CQL 2022.06		76.8
DD 2023.10		75
EDT 2026.03		74.8
IQL 2023.10		73.9
IQL 2026.03		73.9
IQL 2025.11		73.9
DT 2023.10		73.5
Reinformer 2026.03		72.9
MOPO 2021.10		69.4
DD 2026.03		68.9
DT 2023.10		66.6
%BC 2023.10		62.5
QDT 2026.03		58.2
COMBO 2021.10		56
BAIL 2021.10		51.4
MOREL 2021.10		49.8
ROMI-BCQ 2021.10		49.5
BRAC 2021.10		47.9
BCQ 2021.10		41.8
FQL 2025.10		38.8
CQL-Min 2024.01		32.6
UWAC 2021.10		27.1
BC 2025.11		26
BC 2021.10		20.3
BC 2022.06		20.3
BC 2024.01		20.3
BCQ 2021.10		12.5
MOREL 2021.10		12.2
BEAR 2021.10		9.3
BRAC-v 2021.10		4.3
BC 2021.10		2.2
BC 2021.10		2.2
REM 2021.10		1.9
BRAC-P 2021.10		1.7
SAC 2021.10		-0.4
BEAR 2021.10		-2.4