Share your thoughts, 1 month free Claude Pro on usSee more

Offline Reinforcement Learning on Ant-Kinematic

90.34Normalized Score

TABB

Updated 2mo ago

Evaluation Results

Method	Links
TABB 2026.05		90.34
TABB 2026.05		87.05
TABB 2026.05		83.67
MOBODY 2026.05		76.04
TABB 2026.05		67.91
TABB 2026.05		65.1
TABB 2026.05		63.98
IQL 2026.05		59.6
MOBODY 2026.05		59.12
IQL 2026.05		57.8
TABB 2026.05		54.44
DARA 2026.05		54.2
DARA 2026.05		54.1
TABB 2026.05		53.87
TABB 2026.05		51.7
MOBODY 2026.05		50.93
DROCO 2026.05		50.86
MOBODY 2026.05		50.56
IQL 2026.05		50
IQL 2026.05		49.5
MOBODY 2026.05		47.72
DROCO 2026.05		46.89
DROCO 2026.05		46.04
BOSA 2026.05		45.4
MOBODY 2026.05		44.98
DARA 2026.05		44.7
DROCO 2026.05		44.57
IQL 2026.05		43.7
DARA 2026.05		42.3
DARA 2026.05		42
DROCO 2026.05		41.85
IQL 2026.05		37.2
MOBODY 2026.05		37
MOBODY 2026.05		36.86
IQL 2026.05		36.5
DARA 2026.05		36
DARA 2026.05		33.3
BOSA 2026.05		31.7
DROCO 2026.05		29.71
DROCO 2026.05		29.26
DROCO 2026.05		25.55
MOBODY 2026.05		24.62
IQL 2026.05		24.4
DROCO 2026.05		22.88
DARA 2026.05		22.1
BOSA 2026.05		20.9
BOSA 2026.05		19.5
BOSA 2026.05		19.1
BOSA 2026.05		19
BOSA 2026.05		19
IQL 2026.05		18.7
DARA 2026.05		17.8
BOSA 2026.05		14.5
BOSA 2026.05		6.4