Share your thoughts, 1 month free Claude Pro on usSee more

Offline Reinforcement Learning

Benchmarks

Dataset Name	SOTA Method	Metric
D4RL halfcheetah-medium-expert	VIPO	Normalized Score110	169	1mo ago
D4RL hopper-medium-expert	ATAC	Normalized Score119.2	161	2mo ago
D4RL walker2d-medium-expert	PSPO	Normalized Score116.1	140	1mo ago
D4RL Medium-Replay Hopper	NEUBAY	Normalized Score110.6	109	1mo ago
D4RL Medium HalfCheetah	SUMO	Normalized Score84.3	105	2mo ago
D4RL Medium Walker2d	NEUBAY	Normalized Score106.4	104	2mo ago
D4RL walker2d-random	AWAC	Normalized Score510	101	2mo ago
MujoCo halfcheetah	CEDGE-Policy	Normalized Return62.86	97	2mo ago
D4RL Medium-Replay HalfCheetah	Adaptive Policy Selection and Fine-Tuning	Normalized Score95.8	97	2mo ago
D4RL halfcheetah-random	ADMPO	Normalized Score45.4	94	2mo ago
D4RL hopper-random	MOREL	Normalized Score53.6	86	2mo ago
D4RL Walker2d Medium v2	PhyB	Normalized Return95.5	85	1mo ago
OGBench	ReBRAC	AntMaze Giant Navigate54	78	17d ago
D4RL AntMaze	MPCwDWM	AntMaze Medium Play Return94.4	78	1mo ago
D4RL antmaze-umaze (diverse)	FAC	Normalized Score93.5	74	1mo ago
D4RL Gym walker2d (medium-replay)	ROMI-CQL	Normalized Return109.7	73	1mo ago
D4RL Medium Hopper	RRPI	Normalized Score109.4	72	2mo ago
Kitchen Partial	GCPC	Normalized Score90.2	69	2mo ago
D4RL halfcheetah v2 (medium-replay)	CQL	Normalized Score76.9	68	1mo ago
hopper medium	QDFM	Normalized Score3,729	68	1mo ago
D4RL halfcheetah-expert v2	PhyB	Normalized Score113.7	66	1mo ago
D4RL walker2d-expert v2	PhyB	Normalized Score116.3	66	1mo ago
D4RL hopper-expert v2	PhyB	Normalized Score118.9	66	1mo ago
D4RL Gym halfcheetah-medium	SPQR	Normalized Return74.8	65	1mo ago
MuJoCo Hopper	CEDGE-Policy	Normalized Score66.82	64	2mo ago

Showing 25 of 895 rows

...