Share your thoughts, 1 month free Claude Pro on usSee more

Reinforcement Learning on Cheetah-Wind-S dynamics changes (time-step)

-42.3Average Return

Ada-Diffuser + DP (Oracle)

Updated 2mo ago

Evaluation Results

Method	Links
Ada-Diffuser + DP (Oracle) 2026.05		-42.3
Ada-Diffuser + IDQL (Oracle) 2026.05		-44.7
Ada-Diffuser + IDQL 2026.05		-48
Ada-Diffuser + DP 2026.05		-52.9
IDQL + DynaMITE 2026.05		-63.4
DP + DynaMITE 2026.05		-76.5
IDQL 2026.05		-87.8
DP 2026.05		-120.6