Share your thoughts, 1 month free Claude Pro on usSee more

Cooperative Multi-Agent Reinforcement Learning on SMAC 3s5z map

18.7Return

QMIX

Updated 3mo ago

Evaluation Results

Method	Links
QMIX 2026.04		18.7	60.48	12
MAPPO 2026.04		18.5	68.31	11.5
KD-MARL 2026.04		17.2	60.28	9.7
MAPPO 2026.04		16.8	55.66	13.5
VDN 2026.04		16.5	53.42	10.8
KD-MARL 2026.04		16.5	58.17	7.9
QMIX 2026.04		15	50.12	10.2
MAPPO 2026.04		13.5	42.54	12.2
VDN 2026.04		11	40.33	9.8
QMIX 2026.04		10.5	36.95	6
VDN 2026.04		7	24.12	8