MultiAgentBench

Benchmarks

Task Name	Dataset Name	SOTA Result
Multi-agent research collaboration	MultiAgentBench Research	Task Performance75.99	6
Collaborative software engineering	MultiAgentBench Coding (Tree)	Task Performance52.98	6
Collaborative software engineering	MultiAgentBench Coding Graph	Task Performance57.41	6
Multi-agent negotiation	MultiAgentBench Bargaining	Task Performance60.48	6
Multi-agent Video Generation	MultiAgentBench	PSNR14.12	3

Showing 5 of 5 rows