Share your thoughts, 1 month free Claude Pro on usSee more

Agentic Task Success on ALFWorld

87.1Success Rate

ALMA

Updated 5mo ago

Evaluation Results

Method	Links
ALMA 2026.02		87.1
Trajectory Retrieval 2026.02		80
Dynamic Cheatsheet 2026.02		78.6
G-Memory 2026.02		74.8
No Memory 2026.02		67.6
Reasoning Bank 2026.02		67.1
ALMA 2026.02		12.4
G-Memory 2026.02		7.6
Dynamic Cheatsheet 2026.02		5.7
Trajectory Retrieval 2026.02		5.2
Reasoning Bank 2026.02		5.2
No Memory 2026.02		2.9