Share your thoughts, 1 month free Claude Pro on usSee more

Reinforcement Learning on AntMaze large-play D4RL

533Average Episodic Return

GC-Oracle

Updated 3mo ago

Evaluation Results

Method	Links
GC-Oracle 2024.03		533
DiSPO 2024.03		306
USFA 2024.03		250
COMBO 2024.03		248
GC-IQL 2024.03		229
FB 2024.03		165
RaMP 2024.03		134
MOPO 2024.03		128
IQL 2026.04		38.5
O2O-LSVI 2026.04		35.3
Cal-QL 2026.04		31.8
CQL 2026.04		28.8