Share your thoughts, 1 month free Claude Pro on usSee more

PersonaMem

Benchmarks

Task Name	Dataset Name	SOTA Result
Query-Answering	PersonaMem 128K context length	Query-Answering Accuracy70	60
Query-Answering	PersonaMem 32K context length	Query-Answering Accuracy90	60
Query-Answering	PersonaMem 1M context length	Query-Answering Accuracy72	38
Personalized Dialogue Response Generation	PersonaMem 1.0	Overall Score76.06	33
Memory-Augmented Dialogue	PersonaMem v1.0 (test)	Overall Score74.53	28
Dialogue-Style Memory Reasoning	PersonaMem	Exact Match (EM)37.19	24
Multiple-choice Query Answering	PersonaMem (Average)	Accuracy72	22
Long-context Memory Retrieval and Reasoning	PersonaMem 128K	F1 Score23.75	20
Long-context Memory Retrieval and Reasoning	PersonaMem 32K	F1 Score26.45	20
Privacy Extraction	PersonaMem v2 (test)	F1 Score0.9448	18
Response Selection	PersonaMem	Accuracy64.36	16
Long-horizon implicit preference inference	PersonaMem 32k v2	Accuracy59.3	12
Long-horizon memory recall	PersonaMem 32k	Accuracy77.59	12
Language Agent Memory Management	PersonaMem	Recall Facts88.64	12
Question Answering	PersonaMem	Accuracy77.03	12
Agentic Memory Management	PersonaMem	Preference Recall69.7	11
Memory-intensive task	PersonaMem v2	Accuracy47.97	8
Preference evolution over long multi-session histories	PersonaMem 128K context scale	Accuracy47.24	8
Preference evolution over long multi-session histories	PersonaMem 32K context scale	Accuracy57.06	8
Personality-based Memory	PERSONAMEM 32k context	Accuracy57.93	8
Personalized Memory Retrieval	PersonaMem	Precision58.9	8
Question Answering	PersonaMem v1	R-Fact Score52.74	7
Memory-bank storage size measurement	PersonaMem v2	Storage Size (GiB)0.34	6
Persona Memory Management for Language Agents	PersonaMem 128k	Accuracy63.87	5
Persona-based memory dialogue	PersonaMem	Normalized Score65.2	5

Showing 25 of 32 rows