EverMemOS: A Self-Organizing Memory Operating System for Structured Long-Horizon Reasoning

About

Large Language Models (LLMs) are increasingly deployed as long-term interactive agents, yet their limited context windows make it difficult to sustain coherent behavior over extended interactions. Existing memory systems often store isolated records and retrieve fragments, limiting their ability to consolidate evolving user states and resolve conflicts. We introduce EverMemOS, a self-organizing memory operating system that implements an engram-inspired lifecycle for computational memory. Episodic Trace Formation converts dialogue streams into MemCells that capture episodic traces, atomic facts, and time-bounded Foresight signals. Semantic Consolidation organizes MemCells into thematic MemScenes, distilling stable semantic structures and updating user profiles. Reconstructive Recollection performs MemScene-guided agentic retrieval to compose the necessary and sufficient context for downstream reasoning. Experiments on LoCoMo and LongMemEval show that EverMemOS achieves state-of-the-art performance on memory-augmented reasoning tasks. We further report a profile study on PersonaMem v2 and qualitative case studies illustrating chat-oriented capabilities such as user profiling and Foresight. Code is available at https://github.com/EverMind-AI/EverMemOS.

Chuanrui Hu, Xingze Gao, Zuyi Zhou, Dannong Xu, Yi Bai, Xintong Li, Hui Zhang, Tong Li, Chong Zhang, Lidong Bing, Yafeng Deng• 2026

Related benchmarks

Task	Dataset	Result
Long-term memory evaluation	Locomo	Overall F192.3	128
Long-context Memory Retrieval	Locomo	Single-hop96.1	96
Long-context Reasoning	Locomo	F1 (Multi Hop)91.84	78
Long-term Dialogue	LoCoMo (test)	Multi-Hop Accuracy68.79	26
Long-term Memory Retrieval	LongMemEval-S	SSU97.1	19
Long-term Memory Question Answering	LongMemEval-S (500 questions)	KU Accuracy87	16
Long-term Conversational Memory Question Answering	LoCoMo (test)	Single Hop F153.79	15
Long-term conversational Question Answering	LongMemEval	SS User Accuracy94.29	14
Conversational Memory Question Answering	Locomo	Single-Hop J-Score91.08	10
Long-term Memory Question Answering	LoCoMo 0.6.0	Accuracy94.48	10

Showing 10 of 19 rows

Other info

Follow for update

@wizwand_team Discord