Share your thoughts, 1 month free Claude Pro on usSee more

Cooperative Multi-Agent Reinforcement Learning on Reference (last 2% of train)

-25.39Mean Episodic Reward

SACHI

Updated 2mo ago

Evaluation Results

Method	Links
SACHI 2026.05		-25.39
DCG 2026.05		-27.34
QMIX 2026.05		-28.81
MAPPO 2026.05		-34.57
IPPO 2026.05		-34.69
DICG 2026.05		-34.97
FOP 2026.05		-35.38
IQL 2026.05		-36.12
VDN 2026.05		-38.44
QTRAN 2026.05		-39.33
DGN 2026.05		-41.95
CASEC 2026.05		-50.71
QPLEX 2026.05		-65.72