Share your thoughts, 1 month free Claude Pro on usSee more

Multi-Agent Reinforcement Learning on SMAC v2 (test)

84Win Rate (Protoss 5 Units)

HPN-QMIX

Updated 1mo ago

Evaluation Results

Method	Links
HPN-QMIX 2026.02		84	82	78	-
HPN-VDN 2026.02		84	70	79	-
MMSA 2026.02		81	83	81	-
QPLEX-ICES 2025.09		74	-	48	-
QMIX-CERMIC 2025.09		73	-	44	-
MAPPO-CERMIC 2025.09		70	-	48	-
QMIX 2026.02		69	75	73	-
MACE 2025.09		67	-	44	-
QMIX-SPECTRA 2025.09		65	-	45	-
CPM 2025.09		64	-	44	-
SET-QMIX 2026.02		63	64	64	-
MAPPO-DB 2025.09		63	-	43	-
MAPPO 2025.09		61	-	44	-
MAPPO 2025.09		61	-	43	-
QMIX 2025.09		60	-	39	-
MAG 2026.02		58	59	34	-
LMAC 2026.05		57.96	67.87	42.18	-
QMIX+STATE 2026.05		56.4	64.77	40.06	-
MAMBA 2026.02		54	54	32	-
MAIC 2026.05		51.93	63.8	38.59	-
QMIX 2026.05		48.44	61.69	34.79	-
T2MAC 2026.05		48.16	61.67	35.09	-
NDQ 2026.05		48.03	59.2	38.75	-
VDN 2026.02		46	67	62	-
MAPPO 2026.02		38	45	29	-
STAIRS-Former 2026.03		32.8	32.3	25	30
MASIA 2026.05		32.43	54.72	34.22	-
HiSSD 2026.03		28.5	25.1	18.8	24.1
SMS 2026.05		27	34	13.53	-
TarMAC 2026.05		22.56	29.68	15.47	-
FullComm 2026.05		16.93	18.44	6.83	-
ODIS 2026.03		11.6	13.2	8	10.9
MADDPG 2026.02		10	20	9	-
UPDeT-m 2026.03		8.1	7	5	6.7
COLA 2026.05		0.01	10.29	0.19	-
MAPPO 2026.06		-	-	-	18.84
ReDo 2026.06		-	-	-	20.26
ReBorn 2026.06		-	-	-	17.61
KNIFE 2026.06		-	-	-	25.44
MADDPG 2026.06		-	-	-	20.13
ReDo 2026.06		-	-	-	10.48
ReBorn 2026.06		-	-	-	29.16
KNIFE 2026.06		-	-	-	34.55
DGN 2026.06		-	-	-	17.48
KNIFE 2026.06		-	-	-	22.73