Share your thoughts, 1 month free Claude Pro on usSee more

Safe Reinforcement Learning on HalfCheetah vel (offline)

1.85Normalized Reward

Task-Only

Updated 12d ago

Evaluation Results

Method	Links
Task-Only 2026.05		1.85	1
Oracle 2026.05		1	0
Safe-VPL 2026.05		0.96	0.004
SOPL 2026.05		0.93	0.014
Safe-CPL 2026.05		0.92	0.018
RC 2026.05		0.44	0.107