Share your thoughts, 1 month free Claude Pro on usSee more

Offline Reinforcement Learning on hopper medium

3,729Normalized Score

QDFM

Updated 1mo ago

Evaluation Results

Method	Links
QDFM 2026.02		3,729
BCQ 2026.02		3,618
AWBC 2026.02		712
AWAC 2026.02		154
CQL 2026.02		113
GreedyQ 2026.02		111
Q-ALIGN DT 2026.05		102.1
DMG 2026.02		100.6
TD3+BC 2023.10		98.4
DM 2026.05		98.1
SAC-RND 2026.02		97.8
COMBO 2023.10		97.2
Anti-exploration Method 2026.02		97.1
CGDT 2026.05		96.9
QT 2026.05		96.9
QCS 2026.05		96.4
Proposed 2023.10		94.9
OptiDICE 2023.10		94.1
DC 2026.05		92.5
LSDT 2026.05		87.2
O-DICE 2026.02		86.1
ATAC 2023.10		85.6
GPC-SAC 2026.02		82.9
I-TAP 2026.02		74.6
CQL 2023.10		74.3
I-TAP 2026.02		71.43
L-MAP 2026.02		71.08
DT 2026.05		67.6
L-MAP 2026.02		66.68
QDT 2024.02		66.5
IQL 2023.10		66.3
IQL 2026.02		66.2
IQL 2026.05		63.8
I-TAP 2026.02		60.88
DT 2024.02		60.3
DT 2026.02		59.39
TD3+BC 2026.05		59.3
CQL 2024.02		58
DT 2024.02		57.3
DT 2026.02		56.09
TD3-CVAE 2026.02		55.9
L-MAP 2026.02		55.26
BCQ 2023.10		54.5
CQL 2026.02		53
BEAR 2023.10		52.1
DT 2026.02		51.62
QDT 2024.02		50.7
STC 2026.02		43.4
DARA 2025.06		40.61
IQL 2025.12		35.2
IQL 2025.06		32.99
OTDF 2026.02		32.4
IGDF 2025.12		31.6
DARA 2025.12		25.5
OTDF 2025.12		24.2
CQL 2024.02		23.3
BOSA 2025.12		20.6
DVDF-IGDF 2025.12		20.3
DVDF-OTDF 2025.12		19.3
DARA 2026.02		17.3
IGDF 2026.02		15.3
BOSA 2026.02		15.2
MOBODY 2025.06		13.05
MOPO 2025.06		12.96
TD3-BC 2025.06		12.69
BOSA 2025.06		12.67
SRPO 2026.02		12.4
IQL 2026.02		11.2