Share your thoughts, 1 month free Claude Pro on usSee more

Lifelong Agent Bench OS Task

78.8Success Rate (Last Epoch)

MemRL

Updated 1mo ago

Evaluation Results

Method	Links
MemRL 2026.01		78.8	80.4
SkillMAS 2026.05		76.7	-
MemP 2026.01		73.6	74.2
Traj-Bootstrap 2026.05		70	-
RAG 2026.01		69	70
CDMem 2026.05		68	-
No Memory 2026.01		67.4	-
Mem0 2026.01		67	70.2
OPD-Evolver-9B 2026.06		65	-
Self-RAG 2026.01		64.6	73.2
QWEN3.5-397B-A17B 2026.06		63	-
ReAct 2026.05		62	-
MemEvolve 2026.06		61	-
EvolveR 2026.06		59.5	-
Direct LLM 2026.05		59.3	-
STEP-3.5-FLASH (196B) 2026.06		58	-
Memp 2026.06		56	-
ReasoningBank 2026.06		55	-
No Memory 2026.06		52.5	-
Cheatsheet 2026.06		52.5	-
OPD-Evolver-4B 2026.06		49.5	-
EvolveR 2026.06		46.5	-
ExpeL 2026.06		46.5	-
MemEvolve 2026.06		44	-
AWM 2026.06		44	-
Memp 2026.06		41	-
Cheatsheet 2026.06		38.5	-
ReasoningBank 2026.06		38	-
No Memory 2026.06		36.5	-
AWM 2026.06		36	-
ExpeL 2026.06		34.5	-
Pass@10 2026.01		-	75.6