Share your thoughts, 1 month free Claude Pro on usSee more

Reinforcement Learning on AntMaze Large Play

46.7OSR

RankQ

Updated 2mo ago

Evaluation Results

Method	Links
RankQ 2026.05		46.7	0
CQL 2026.05		43.3	0
Cal-QL 2026.05		36.7	67.7
RankQ 2026.05		36.7	91.2
Cal-QL 2026.05		30	0
CQL 2026.05		28.3	82.8
Hybrid RL 2026.05		0	0
SAC 2026.05		0	0
SAC 2026.05		0	0