Online Reinforcement Learning

Benchmarks

Dataset Name	SOTA Method	Metric
OpenAI Gym MuJoCo Normalized v4	NC-LQL	Normalized Mean Return95.5	50	4mo ago
Meta-World	LaGO	Reward1.343	10	1mo ago
CLEVR-Robot	LaGO	Reward19.4	10	1mo ago
AndroidWorld	StainFlow	Success Rate62.28	9	1mo ago
Antmaze large-diverse	RLPD	Score93.5	8	4mo ago
Antmaze large-play	RLPD	Score94.8	8	4mo ago
Antmaze medium-diverse	RLPD	Score98.5	8	4mo ago
Antmaze medium-play	RLPD	Score98.7	8	4mo ago
Antmaze umaze-diverse	BC-PEX	Score99.9	8	4mo ago
Antmaze umaze	RLPD	Score99.9	8	4mo ago
MinAtar (\|A\|=216, k=3) Macro-Action (online)		Breakout Score11.98	5	2mo ago
WalkerWalk DMControl (final)	GoRL(FM)	Normalized Return919.61	5	4mo ago
HopperStand DMControl (final)	GoRL(Diff)	Normalized Return874.63	5	4mo ago
FishSwim DMControl (final)	GoRL(FM)	Normalized Return641.01	5	4mo ago
FingerTurnHard DMControl (final)	GoRL(Diff)	Normalized Return884.59	5	4mo ago
DMControl FingerSpin (final)	GoRL(FM)	Normalized Return903.92	5	4mo ago
CheetahRun DMControl (final)	GoRL(Diff)	Normalized Return902.24	5	4mo ago

Showing 17 of 17 rows