Share your thoughts, 1 month free Claude Pro on usSee more

Offline Reinforcement Learning on D4RL AntMaze v0 (medium-play)

88.1Normalized Score

OFQL

Updated 7d ago

Evaluation Results

Method	Links
OFQL 2026.06		88.1
BFQ 2026.06		87
DQL 2026.06		86
GTP 2025.10		83.3
QIPO-Diff 2025.10		82.8
SRPO 2026.06		80.7
SORL 2026.06		80.1
QIPO-OT 2025.10		80
FQL 2026.06		78
IQL 2026.06		75.5
EDP 2026.06		73.3
IDQL 2026.06		67.3
TD3-BC 2026.06		10.6
TD3+BC 2021.06		3
BC 2026.06		0