Share your thoughts, 1 month free Claude Pro on usSee more

Offline-to-online Reinforcement Learning on D4RL antmaze-medium-play

81.7OSR

CQL

Updated 2mo ago

Evaluation Results

Method	Links
CQL 2026.05		81.7	98
RankQ 2026.05		81.7	98.7
CQL 2026.05		78.3	98.3
Cal-QL 2026.05		75	98.9
RankQ 2026.05		75	97.7
Cal-QL 2026.05		71.7	97.8
Hybrid RL 2026.05		13.3	98.3
SAC 2026.05		11.7	98.8
SAC 2026.05		0	0