Continuous Control

Benchmarks

Dataset Name	SOTA Method	Metric
MuJoCo Walker2d v4	Opti-DICE	Normalized Performance13,060	51	18d ago
MuJoCo Ant v4	TD7	Average Return8,509	46	2mo ago
DMControl 500k		Spin Score979	42	4mo ago
DMControl 100k	Sampled MuZero	DMControl: Finger Spin Score986.38	38	4mo ago
MuJoCo HalfCheetah v4	TD7	Average Return17,433	36	2mo ago
LunarLanderContinuous offline trajectories v2	MFRL	Episodic Cumulative Reward254.55	35	4mo ago
Mountain Car POMDP	AG-PFT-DPW	Mean Performance26.96	30	2mo ago
MuJoCo HalfCheetah v4	AD-SAC	Normalized Performance107	30	18d ago
MuJoCo Hopper v4	tdBN	Normalized Performance3,592	28	4mo ago
MountainCar Source		Success Rate100	27	4mo ago
MuJoCo Ant	TOP-TD3	Average Reward6,336	26	4mo ago
MuJoCo HalfCheetah	TOP-TD3	Average Reward13,144	25	3mo ago
D4RL Hopper medium	OFQL	Normalized Return103.6	24	1mo ago
Humanoid 17-Dof	SATR	Final Return13,860	21	4mo ago
MuJoCo Swimmer v4	PPO	Total Reward362.4	19	2mo ago
D4RL Walker2d medium	CORAL	Normalized Return88.86	19	1mo ago
Hopper 3-Dof	SATR	Final Return2,735	18	4mo ago
MountainCar Drift II - Dynamics Shift		Success Rate100	18	4mo ago
MountainCar Drift I - Dynamics Shift		Success Rate100	18	4mo ago
MuJoCo Reacher v4	DIDA	Normalized Performance103	18	4mo ago
MuJoCo Pusher v4	AD-SAC	Normalized Performance1.36	18	4mo ago
MuJoCo HumanoidStandup v4	VDPO	Normalized Performance1.29	18	4mo ago
MuJoCo Humanoid v4	VDPO	Normalized Performance (Ret_nor)115	18	4mo ago
DMC-GB video hard	SGQN	Cartpole Swingup Score54,443	18	2mo ago
MuJoCo Reacher	TRPO	Average Reward6.22	18	3mo ago

Showing 25 of 513 rows

...