Share your thoughts, 1 month free Claude Pro on usSee more

Multi-Agent Coordination on XOR game n=k=2 (train eval)

100Success Rate (Greedy Policy pi*)

MAT

Updated 2mo ago

Evaluation Results

Method	Links
MAT 2026.05		100	100
Diamond Attention 2026.05		100	100
MAPPO 2026.05		0	50
QMIX 2026.05		0	50
IPPO 2026.05		0	50
MASAC 2026.05		0	50
pH-MARL 2026.05		0	50
GSA 2026.05		0	50
Diamond Attention (w/o mask) 2026.05		0	50
Diamond Attention (dropout) 2026.05		0	50