Offline Inverse Reinforcement Learning

Benchmarks

Dataset Name	SOTA Method	Metric
D4RL HalfCheetah Medium v2	Offline ML-IRL	Cumulative Reward9,313.29	8	4mo ago
MuJoCo walker2d medium-exp		Average Reward5,383.98	5	4mo ago
MuJoCo halfcheetah (medium-exp)		Average Reward12,174.61	5	4mo ago
MuJoCo hopper (medium-exp)		Average Reward3,512.09	5	4mo ago
MuJoCo walker2d (medium-replay)		Avg Reward5,383.98	5	4mo ago
MuJoCo halfcheetah (medium-replay)		Average Reward12,174.61	5	4mo ago
MuJoCo hopper (medium-replay)		Average Reward3,512.09	5	4mo ago
MuJoCo walker2d medium		Avg Reward5,383.98	5	4mo ago
MuJoCo halfcheetah (medium)		Average Reward12,174.61	5	4mo ago
MuJoCo hopper medium		Average Reward3,512.09	5	4mo ago
D4RL Walker2d Medium-Expert v2	Offline ML-IRL	Cumulative Reward4,049.43	4	4mo ago
D4RL HalfCheetah v2 (medium-expert)	Offline ML-IRL	Cumulative Reward10,812.15	4	4mo ago
D4RL Hopper Medium-Expert v2	Offline ML-IRL	Cumulative Reward3,366.23	4	4mo ago
D4RL Walker2d Medium-Replay v2	Offline ML-IRL	Cumulative Reward4,100.99	4	4mo ago
D4RL Hopper Medium-Replay v2	ValueDICE	Cumulative Reward2,417.83	4	4mo ago
D4RL Walker2d Medium v2	Offline ML-IRL	Cumulative Reward4,121.68	4	4mo ago
D4RL Hopper Medium v2	ValueDICE	Cumulative Reward2,417.83	4	4mo ago

Showing 17 of 17 rows