Share your thoughts, 1 month free Claude Pro on usSee more

Offline Reinforcement Learning on D4RL antmaze-umaze (diverse)

93.5Normalized Score

FAC

Updated 1mo ago

Evaluation Results

Method	Links
FAC 2026.02		93.5
Decision Mamba 2024.06		90
FQL 2026.02		89
GCIQL 2023.07		88.8
ReBRAC 2026.02		88.3
CQL 2026.02		84
SRPO 2026.02		82.1
GTP 2025.10		81.9
QQL 2025.11		81.3
IDQL 2026.02		80.2
MCQ 2026.02		80
IQL 2025.11		79.5
EPQ 2026.02		78.3
CAC 2026.02		77.6
XQL 2025.11		77.2
SPAR-PROJ 2026.05		76.7
QIPO-OT 2026.02		76.1
QIPO-OT 2025.10		76.1
DWSL 2023.07		74.6
QIPO-Diff 2025.10		73.9
TD3+BC 2021.06		71.4
TD3+BC 2026.02		71.4
TD3+BC 2025.11		71.3
IQL 2023.07		71.2
GCPC 2023.07		71.2
LaMo 2024.06		70
RvS-G 2023.07		66.2
SAC-RND 2026.02		66
BC 2025.11		64.8
ROMI-CQL 2021.10		63.6
BC 2023.07		63.4
SPAR-MLP 2026.05		63.3
IQL 2026.02		62.2
PLAS 2026.05		62
IDQL 2026.05		62
ROMI-BCQ 2021.10		61.2
BC 2024.06		61
DT 2024.06		61
COMBO 2021.10		57.3
Diff-QL 2026.05		57.3
WGCSL 2023.07		55.6
CQL-AW 2026.05		54
CQL 2025.11		53.8
DT 2023.07		53.4
MXQL 2025.11		53.2
BAIL 2021.10		52
EQL 2026.05		50.8
BiTrajDiff 2025.06		48.8
BCQ 2021.10		48
BiTrajDiff 2025.06		47.8
CQL 2023.07		47.4
BC 2021.10		47
RTDiff 2025.06		46.4
Synther 2025.06		44.8
DiffStitch 2025.06		42.6
Synther 2025.06		42.4
Base 2025.06		42
RTDiff 2025.06		40.6
Base 2026.05		40
DiffStitch 2025.06		39.2
CQL 2026.05		39.2
BEAR 2021.10		37.7
IQL 2026.05		37.3
Base 2025.06		31.6
BCQ 2026.05		28
LAPO 2026.05		28
CQL 2021.10		6.3
TD3+BC 2026.05		1.7
BRAC-P 2021.10		0
BRAC-v 2021.10		0
MOPO 2021.10		0
MOREL 2021.10		0
Repb-SDE 2021.10		0
AWAC 2026.05		-0.8