Share your thoughts, 1 month free Claude Pro on usSee more

Ant

Benchmarks

Task Name	Dataset Name	SOTA Result
Reinforcement Learning	Ant v5	Average Return6,633.8	57
Continuous Robot Control	Ant v3 (test)	Reward5,648	48
Reinforcement Learning	Ant v4	Average Return5,527	26
Reinforcement Learning	Ant v3	Average Final Return9,108	26
Offline Black-Box Optimization	Ant	Normalized Median Score0.935	25
Locomotion	Ant IID (test)	Mean Episode Reward2,240	24
Locomotion Control	Ant sigma 0.5 (test)	Episode Reward974	24
Locomotion Control	Ant sigma 0.3 (test)	Episode Reward1,723	24
Locomotion Control	Ant sigma 0.1 (test)	Episode Reward2,240	24
Locomotion Control	Ant sigma 0.7 (test)	Episode Reward306	18
Reinforcement Learning	Ant	Average Reward7,010.88	16
Offline Reinforcement Learning	Ant kinematic shifts	Score120	16
Locomotion	Ant	Reward882	16
Continuous Control	Ant v4	Average Return7,518.3	15
Offline Reinforcement Learning	Ant Medium D4RL	Normalized Score96.4	14
Offline Policy Adaptation	ant medium-expert	Normalized Score79.3	14
Offline Policy Adaptation	ant medium-replay	Normalized Score76.2	14
Offline Policy Adaptation	ant medium	Normalized Score77.2	14
Reinforcement Learning	Ant v5	Average AUC (z-scored)2.24	13
Reinforcement Learning	Ant delta=[0.2^4, 0.5^4], kappa=2.5 v5 (test)	Return4,260	12
Continuous Control	Ant v5	Normalized Mean Return1.14	12
Reinforcement Learning	Ant fixed linear adversary	Average Performance8,069	12
Worst-case time-constrained reinforcement learning	Ant MuJoCo (test)	Normalized Worst-Case Reward1.66	12
Robust Reinforcement Learning	Ant MuJoCo (fixed exponential adversary)	Average Performance7,724	12
Continuous Control	Ant MuJoCo (test)	Worst-case Performance7,534	12

Showing 25 of 134 rows