Share your thoughts, 1 month free Claude Pro on usSee more

Offline Reinforcement Learning under Gravity Shift on MuJoCo Walker2d

65.2Normalized Return

TCE(SM)

Updated 2mo ago

Evaluation Results

Method	Links
TCE(SM) 2026.05		65.2
OTDF 2026.05		61.1
DARA 2026.05		56.4
OTDF 2026.05		53.3
IQL* 2026.05		49.1
TCE(SM) 2026.05		46.9
SRPO 2026.05		46.4
DARA 2026.05		45.8
SRPO 2026.05		45.8
TCE(SM) 2026.05		45.6
IGDF 2026.05		45.3
OTDF 2026.05		44.8
IGDF 2026.05		44.7
OTDF 2026.05		44
BOSA 2026.05		43.7
TCE(SM) 2026.05		43.2
DARA 2026.05		41.6
BOSA 2026.05		41.3
BOSA 2026.05		40.9
TCE(SM) 2026.05		40.9
IQL* 2026.05		40.4
BOSA 2026.05		40.1
IQL* 2026.05		39.9
SRPO 2026.05		39.5
BOSA 2026.05		38
IQL* 2026.05		37.3
OTDF 2026.05		36.6
TCE(SM) 2026.05		36.6
SRPO 2026.05		36.4
TCE(OG) 2026.05		36.3
IGDF 2026.05		36.2
DARA 2026.05		36
TCE(OG) 2026.05		35.8
IQL* 2026.05		35.7
IGDF 2026.05		35.4
SRPO 2026.05		34
IGDF 2026.05		33.8
TCE(OG) 2026.05		33
OTDF 2026.05		32.7
BOSA 2026.05		32.3
OTDF 2026.05		31.6
TCE(OG) 2026.05		31.6
OTDF 2026.05		31.3
DARA 2026.05		30.7
OTDF 2026.05		30.2
TCE(OG) 2026.05		28.6
DARA 2026.05		28.4
IQL* 2026.05		28.1
TCE(OG) 2026.05		27.4
IGDF 2026.05		22.1
TCE(OG) 2026.05		21.5
SRPO 2026.05		21.4
TCE(OG) 2026.05		20.6
TCE(OG) 2026.05		20.3
TCE(SM) 2026.05		20.3
TCE(SM) 2026.05		18.2
SRPO 2026.05		17.9
DARA 2026.05		15.9
IQL* 2026.05		15.8
DARA 2026.05		15.7
TCE(SM) 2026.05		15.6
IQL* 2026.05		15.3
SRPO 2026.05		15.3
IGDF 2026.05		15.2
IQL* 2026.05		14.6
DARA 2026.05		14.1
IGDF 2026.05		13.9
SRPO 2026.05		13.7
IGDF 2026.05		11.6
BOSA 2026.05		7.6
BOSA 2026.05		7.1
BOSA 2026.05		4.8