Share your thoughts, 1 month free Claude Pro on usSee more

Maze2D

Benchmarks

Task Name	Dataset Name	SOTA Result
Offline Reinforcement Learning	Maze2D medium	Normalized Return179.2	38
Offline Reinforcement Learning	Maze2D umaze	Normalized Return141	38
Offline Reinforcement Learning	Maze2D large	Normalized Return96.8	33
Offline Reinforcement Learning	Maze2D large v1	Normalized Return220.66	30
Offline Reinforcement Learning	Maze2D medium v1	Normalized Return166.82	30
State Exploration	Maze2D Square-b	State Coverage Ratio85	22
Robotic Path Planning	Maze2D (test)	BS1-1	22
Offline Reinforcement Learning	Maze2D umaze v1	Normalized Return52.2	18
Constrained Navigation	Maze2D Narrow	Success Rate94	16
Constrained Navigation	Maze2D Broad	Success Rate (SR)97	16
Planning and Control	maze2d-umaze v1 (100 episodes, 300 steps/ep)	Score165.19	16
Reward Conditioning (RC)	Maze2D (test)	Reward2.74	16
Behavior Cloning (BC)	Maze2D (test)	Reward2.74	16
State Exploration	Maze2D Square-tree	State Coverage Ratio50	11
State Exploration	Maze2D Corridor2	State Coverage Ratio93	11
State Exploration	Maze2D Square-d	State Coverage Ratio0.77	11
State Exploration	Maze2D Square-c	State Coverage Ratio74	11
State Exploration	Maze2D Square-a	State Coverage Ratio87	11
Long horizon planning	Maze2D U-Maze	Normalized Return185.3	10
Offline Reinforcement Learning	Maze2D large v0 (test)	Score187.8	10
Offline Reinforcement Learning	Maze2D medium v0 (test)	Score152.3	10
Offline Reinforcement Learning	Maze2D umaze v0 (test)	Overall Score111	10
Continuous Control	Maze2D large	Total Reward361	9
Continuous Control	Maze2D medium	Total Reward416.28	9
Continuous Control	Maze2D umaze	Total Reward182.1	9

Showing 25 of 55 rows