Share your thoughts, 1 month free Claude Pro on usSee more

Reinforcement Learning on Walker2d v4

39,641,353Avg Return

MDC-SAN

Updated 1mo ago

Evaluation Results

Method	Links
MDC-SAN 2026.02		39,641,353
pop-SAN 2026.02		33,071,514
Vanilla LIF 2026.02		18,621,450
DSN 2026.02		4,436,196
ANN 2026.02		4,340,383
PT-LIF 2026.02		4,314,423
ANN-SNN 2026.02		4,235,354
ILC-SAN 2026.02		4,200,717
C-DSAC 2026.04		4,808
S-PLIF 2026.01		4,497
PLIF 2026.01		4,445
PDA 2026.03		4,367.1
S-PLIF 2026.01		4,271
TRPO 2026.03		4,128.8
ReLU 2026.01		4,050
PLIF 2026.01		4,003
Fixed β 2026.06		3,995
PPO-Clip 2026.06		3,717
per-sample PPO-KL 2026.06		3,717
Adaptive β 2026.06		3,639
PPO 2026.03		3,277
NPG 2026.03		2,923.2