AlfWorld

Benchmarks

Task Name	Dataset Name	SOTA Result
Interactive Decision-making	ALFWorld	Overall Success Rate99.6	398
Embodied Task	ALFWorld	Overall Success Rate97.5	183
Embodied Reasoning	ALFWorld	Accuracy0.96	151
Embodied Task Completion	ALFWorld	Success Rate94	106
Instruction Following	ALFWorld	Accuracy89.3	82
Interactive Decision Making	ALFWorld (test)	Success Rate96.87	81
Interactive Task Completion	ALFWorld	Pick Success Rate100	72
Interactive Decision Making	ALFWorld Unseen	Success Rate97.76	67
Instruction Following	ALFWorld (val seen)	Success Rate (SR)88.57	65
Instruction Following	ALFWorld (test)	Success Rate91.4	55
Interactive Instruction Following	ALFWorld Unseen	Success Rate86.68	54
Embodied Task Completion	ALFWorld	Pick Success Rate100	54
Embodied decision-making	ALFWorld	Success Rate100	51
Embodied Decision Making	ALFWorld held-out (test)	Score95.5	49
Interactive Decision Making	ALFWorld Seen	Success Rate97.86	47
Agentic reasoning	ALFWorld	Success Rate76.02	45
Embodied Agent Task	ALFWorld Unseen	Success Rate79.1	40
Agent Task	AlfWorld	Success Rate86.7	40
Embodied Instruction Following	AlfWorld	Average Success Rate99.3	38
Interactive Agent Task	ALFWorld	Pick Success Rate98.9	36
Interactive Decision Making	ALFWorld Seen (val)	Pick Reward100	33
Multi-turn Agent Interaction	ALFWorld (test)	Success Rate (Pick)100	31
Interactive Environment Task Completion	ALFWorld (Unseen)	Average Reward91.8	31
Interactive Environment Task Completion	ALFWorld (Seen)	Average Reward90.2	31
Embodied Agent	ALFWorld	Success Rate100	31

Showing 25 of 198 rows

...