Offline Reinforcement Learning on D4RL walker2d medium-replay v2

100.6Normalized Score

Uncertainty-Aware Rank-One MIMO Q Network

Updated 1mo ago

Evaluation Results

Method	Links
Uncertainty-Aware Rank-One MIMO Q Network 2026.02		100.6
ADM 2026.05		95.6
EDAC-10 2026.02		94
CPED 2023.01		91.9
SPOT 2023.01		91.6
DMG 2026.05		89.7
RAMBO 2026.05		89.2
EDAC 2022.10		87.1
PhyB 2026.05		85.4
EPQ 2026.05		85.3
TD3+BC 2023.01		81.8
CQL 2026.02		81.8
TD3-BC 2026.02		81.8
PMDB 2022.10		79.9
PMDB 2026.05		79.9
PBRL 2026.02		77.7
CQL 2023.01		77.2
CQL 2022.10		76.8
CQL 2026.05		76.8
IQL 2023.01		73.8
MOPO 2026.02		73.7
IQL 2026.02		70.9
DT 2023.01		66.6
TAILO 2023.11		61.2
MOReL 2023.11		49.8
Onestep RL 2023.01		49.5
MOReL 2022.10		40.8
MOReL 2026.05		40.8
BRAC 2022.10		40.1
MOPO 2023.11		39
DROCO 2025.12		27.7
AWAC 2023.01		27
BC 2023.01		26
TD3+BC 2026.05		25.2
UWAV 2026.02		23.6
BC 2022.10		20.3
CQL 2025.12		17.8
DARA 2025.12		15.6
BCQ 2026.02		15.2
IQL 2025.12		12.6
BEAR 2022.10		12.2
FQL 2026.05		11.4
IGDF 2025.12		11.2
OTDF 2025.12		10.7
BEAR 2026.02		7
BOSA 2025.12		4.8