Share your thoughts, 1 month free Claude Pro on usSee more

Overcooked

Benchmarks

Task Name	Dataset Name	SOTA Result
CNOT minimization	Overcooked setting circuits	Avg CNOT Count3.52	26
Coordination	Overcooked Cramped Room layout v1	SP257	14
Coordination	Overcooked	Time43.53	14
Multi-agent coordination	Overcooked Coord. Ring	Average Return41.3	10
Human-Agent Coordination	Overcooked Multi-strategy Counter (human evaluation)	Average Score93.09	9
Human-Agent Coordination	Overcooked Counter Circuit (human evaluation)	Average Score91.11	9
Knowledge-Gap Localization	Overcooked	Loc Recall100	8
Multi-agent coordination	Overcooked Overall	Return68.79	8
Multi-agent coordination	Overcooked Bothway Coord.	Return101.93	8
Multi-agent coordination	Overcooked Asymm. Adv.	Return134.01	8
Multi-agent coordination	Overcooked Counter Circ.	Return28.28	8
Multi-agent coordination	Overcooked Coord. Ring Multi-recipe	Return45.96	8
Zero-Shot Coordination	Overcooked Asymmetric Advantages layout v1	SP500	7
Zero-Shot Coordination	Overcooked Forced Coordination layout v1	SP200	7
Zero-Shot Coordination	Overcooked Coordination Ring layout v1	SP333	7
Zero-Shot Coordination	Overcooked Counter Circuit layout v1	SP Score246	7
Coordination	Overcooked Forced Coordination layout v1	SP200	7
Coordination	Overcooked Coordination Ring layout v1	SP333	7
Coordination	Overcooked Counter Circuit layout v1	SP246	7
Zero-Shot Coordination	Overcooked Unident_s environment (test)	Sparse Reward78.5	7
Zero-Shot Coordination	Overcooked Random0_Medium (test)	Shaped Reward146.1	7
Zero-Shot Coordination	Overcooked Random3 environment (evaluation)	Sparse Reward131.4	7
Zero-Shot Coordination	Overcooked Random3	Shaped Reward107.4	7
Zero-Shot Coordination	Overcooked Random0_Medium	Sparse Reward59.3	7
Multi-agent coordination	Overcooked cross-play official AI library	Time48.05	7

Showing 25 of 63 rows