Share your thoughts, 1 month free Claude Pro on usSee more

Offline Reinforcement Learning on walker2d medium-replay

101.3Normalized Score

Q-ALIGN DT

Updated 1mo ago

Evaluation Results

Method	Links
Q-ALIGN DT 2026.05		101.3
Proposed 2023.10		99.6
QT 2026.05		98.5
Anti-exploration Method 2026.02		96.3
QCS 2026.05		94.1
DMG 2026.02		89.7
SAC-RND 2026.02		88.7
ATAC 2023.10		86.5
GPC-SAC 2026.02		86.2
DM 2026.05		85.5
O-DICE 2026.02		83.6
CQL 2026.02		81.8
TD3+BC 2026.05		81.8
C-LAP 2025.12		81.2
DT 2026.05		79.4
CGDT 2026.05		78.1
DC 2026.05		76.6
LAWM 2025.12		75.9
RADT 2026.05		75.9
C-LAP 2025.12		75.7
I-TAP 2026.02		75.11
LSDT 2026.05		74.7
IQL 2023.10		73.9
IQL 2026.02		73.8
IQL 2026.05		73.7
L-MAP 2026.02		71.98
I-TAP 2026.02		71.9
Rev. KL Reg. 2021.06		71.6
Easy BCQ 2021.06		66.4
L-MAP 2026.02		64.68
TD3+BC 2025.12		63.9
I-TAP 2026.02		60.7
DT 2024.02		60.2
DT 2026.02		58.49
QDT 2024.02		58.2
COMBO 2023.10		56
IDM-TD3+BC 2025.12		52.3
DT 2024.02		51.6
L-MAP 2026.02		50.64
Exp. Weight 2021.06		49.3
DT 2026.02		42.78
TD3+BC 2025.12		35.9
TD3+BC 2023.10		34.4
DT 2026.02		29.91
QDT 2024.02		29.6
CQL 2024.02		26.7
Fu et al. 2021.06		26.7
BC 2021.06		23.9
OptiDICE 2023.10		21.6
CQL 2023.10		20.8
BEAR 2023.10		19.2
TD3-CVAE 2026.02		15.4
BCQ 2023.10		15
DVDF-OTDF 2025.12		4.8
IGDF 2025.12		4.4
OTDF 2025.12		4.1
IQL 2025.12		3.6
CQL 2024.02		3.2
DVDF-IGDF 2025.12		3
DARA 2025.12		2.9
BOSA 2025.12		0