Share your thoughts, 1 month free Claude Pro on usSee more

Multi-agent Reinforcement Learning on Predator-Prey Diagonal (PP-D)

36.5Reward

MMR

Updated 2mo ago

Evaluation Results

Method	Links
MMR 2026.05		36.5
NS 2026.05		36.2
ST 2026.05		36.1
VL 2026.05		36
VL 2026.05		35.8
ST 2026.05		35.8
ML 2026.05		35.7
J-W 2026.05		35.6
CBTS 2026.05		35.5
CBTS 2026.05		35.5
ST 2026.05		35.5
MMR 2026.05		35.4
NS 2026.05		35.4
NS 2026.05		35.4
J-M 2026.05		35.2
CBTS 2026.05		35.2
MMR 2026.05		35.2
ML 2026.05		35.2
ML 2026.05		34.9
J-W 2026.05		34.6
VL 2026.05		34.6
J-M 2026.05		33.2
J-W 2026.05		32.9
J-M 2026.05		29.7