Share your thoughts, 1 month free Claude Pro on usSee more

Multi-Agent Coordination on XOR game Generalization (Train n=2, k=3; Eval n=3, k=3)

0Success Rate (Greedy Policy)

MAPPO

Updated 2mo ago

Evaluation Results

Method	Links
MAPPO 2026.05		0	22
QMIX 2026.05		0	22
IPPO 2026.05		0	22
MASAC 2026.05		0	22
pH-MARL 2026.05		0	22
GSA 2026.05		0	22
MAT 2026.05		0	44
Diamond Attention 2026.05		0	0
Diamond Attention (w/o mask) 2026.05		0	22
Diamond Attention (dropout) 2026.05		0	22