Share your thoughts, 1 month free Claude Pro on usSee more

Cooperative Multi-Agent Reinforcement Learning on Adversary (last 2% of train)

85.04Mean Episodic Reward

SACHI

Updated 2mo ago

Evaluation Results

Method	Links
SACHI 2026.05		85.04
DGN 2026.05		83.54
CASEC 2026.05		81.55
QTRAN 2026.05		79.79
QPLEX 2026.05		65.69
FOP 2026.05		44.68
DCG 2026.05		40.35
DICG 2026.05		36.51
IQL 2026.05		33.46
MAPPO 2026.05		31.83
IPPO 2026.05		23.54
VDN 2026.05		18.69
QMIX 2026.05		10.45