Share your thoughts, 1 month free Claude Pro on usSee more

Online Reinforcement Learning on OpenAI Gym MuJoCo Normalized v4

95.5Normalized Mean Return

NC-LQL

Updated 4mo ago

Evaluation Results

Method	Links
NC-LQL 2026.02		95.5
NC-LQL 2026.02		92.2
NC-LQL 2026.02		91.4
DPMD 2026.02		84.7
NC-LQL 2026.02		84.5
DPMD 2026.02		83.3
DPMD 2026.02		80.2
DIPO 2026.02		79.8
DIPO 2026.02		79.6
SDAC 2026.02		78
SDAC 2026.02		76.7
DACER 2026.02		76
DIPO 2026.02		75.7
DACER 2026.02		75.5
DPMD 2026.02		75.4
DIPO 2026.02		74.8
SDAC 2026.02		73.3
DPMD 2026.02		72
DACER 2026.02		71.9
SAC 2026.02		71.3
NC-LQL 2026.02		71.2
SAC 2026.02		70.7
SDAC 2026.02		69.6
DACER 2026.02		69.4
SAC 2026.02		66.4
SDAC 2026.02		65.1
MFP 2026.02		64.8
SAC 2026.02		63.9
LQL 2026.02		63.7
LQL 2026.02		63.4
DIPO 2026.02		62.2
MFP 2026.02		61.4
DACER 2026.02		61
MFP 2026.02		61
LQL 2026.02		57.7
LQL 2026.02		56.2
QSM 2026.02		55.3
QSM 2026.02		55
MFP 2026.02		54.5
QSM 2026.02		53.9
QSM 2026.02		53.3
LQL 2026.02		52.6
SAC 2026.02		46.1
QSM 2026.02		45.6
QVPO 2026.02		45
QVPO 2026.02		44.7
MFP 2026.02		44.1
QVPO 2026.02		42.9
QVPO 2026.02		40.8
QVPO 2026.02		38.6