Share your thoughts, 1 month free Claude Pro on usSee more

Reinforcement Learning on AdroitHandDoor v1

1,725Average Return

Causal PBRS

Updated 5mo ago

Evaluation Results

Method	Links
Causal PBRS 2026.02		1,725
T-REX 2026.02		1,659
SAC Baseline 2026.02		1,472
Causal PBRS 2026.02		1,289
CQL 2026.02		415
CQL 2026.02		308
Trex 2026.02		105
Baseline 2026.02		71
Recurrent SAC 2026.02		-27
Recurrent SAC 2026.02		-27
Log-barrier DDPG 2025.09		-36
DDPG 2025.09		-39.3