Share your thoughts, 1 month free Claude Pro on usSee more

Cooperative Multi-Agent Reinforcement Learning on Disperse (last 2% of train)

-0.36Mean Episodic Reward

DICG

Updated 2mo ago

Evaluation Results

Method	Links
DICG 2026.05		-0.36
SACHI 2026.05		-0.37
DGN 2026.05		-0.39
FOP 2026.05		-1.12
DCG 2026.05		-1.16
CASEC 2026.05		-2
IQL 2026.05		-2.36
MAPPO 2026.05		-2.54
QMIX 2026.05		-2.57
VDN 2026.05		-2.59
IPPO 2026.05		-2.78
QPLEX 2026.05		-2.99
QTRAN 2026.05		-4.55