Share your thoughts, 1 month free Claude Pro on usSee more

Cooperative Multi-Agent Reinforcement Learning on SMAC 5m_vs_6m map

19.1Return

QMIX

Updated 3mo ago

Evaluation Results

Method	Links
QMIX 2026.04		19.1	58.93	12.3
MAPPO 2026.04		18	61.85	12
KD-MARL 2026.04		16.8	58.66	10
MAPPO 2026.04		16.5	58.09	14
KD-MARL 2026.04		16.5	56.15	8
VDN 2026.04		16	50.1	11
QMIX 2026.04		14	50.12	10.5
MAPPO 2026.04		13	44.78	12.7
VDN 2026.04		11	38.22	10.2
QMIX 2026.04		10	38.79	6.2
VDN 2026.04		7	25.14	8.2