Share your thoughts, 1 month free Claude Pro on usSee more

Offline Reinforcement Learning on walker2d medium

1,248Normalized Score

QDFM

Updated 1mo ago

Evaluation Results

Method	Links
QDFM 2026.02		1,248
BCQ 2026.02		930
CQL 2026.02		665
GreedyQ 2026.02		659
AWBC 2026.02		248
Q-ALIGN DT 2026.05		94.7
DMG 2026.02		92.4
SAC-RND 2026.02		91.6
LAWM 2025.12		91.4
ATAC 2023.10		89.6
Anti-exploration Method 2026.02		89.3
QT 2026.05		88.8
QCS 2026.05		88.2
GPC-SAC 2026.02		87.6
O-DICE 2026.02		84.9
DM 2026.05		83.8
TD3+BC 2026.05		83.7
COMBO 2023.10		81.9
TD3+BC 2023.10		81.7
LSDT 2026.05		81
Proposed 2023.10		80.8
IQL 2026.05		79.9
CQL 2024.02		79.2
DC 2026.05		79.2
CGDT 2026.05		79.1
IQL 2023.10		78.3
IQL 2026.02		78.3
CQL 2023.10		77.2
I-TAP 2026.02		76.56
L-MAP 2026.02		75.77
DT 2026.05		74
DT 2024.02		73.3
CQL 2026.02		73.3
TD3+BC 2025.12		71.5
C-LAP 2025.12		71.1
DT 2024.02		69.9
C-LAP 2025.12		68.7
TD3-CVAE 2026.02		68.2
QDT 2024.02		67.1
TD3+BC 2025.12		64.7
IDM-TD3+BC 2025.12		64.3
QDT 2024.02		63.7
I-TAP 2026.02		60.22
BEAR 2023.10		59.1
L-MAP 2026.02		55.96
I-TAP 2026.02		54.6
BCQ 2023.10		53.1
DT 2026.02		51.89
L-MAP 2026.02		50.1
DT 2026.02		39.16
DT 2026.02		30.69
DVDF-IGDF 2025.12		24.3
DVDF-OTDF 2025.12		23.7
OptiDICE 2023.10		21.8
OTDF 2025.12		19.3
IQL 2025.12		16.4
DARA 2025.12		15.8
IGDF 2025.12		14.3
BOSA 2025.12		10.6
CQL 2024.02		0
AWAC 2026.02		-18