MemOS:一种用于 AI 应用的记忆操作系统


MemOS:一种用于 AI 应用的记忆操作系统

仅用于站内搜索,没有排版格式,具体信息请跳转上方微信公众号内链接

大型语言模型(LLM)已成为通用人工智能(AGI)的重要基础设施,然而其缺乏明确定义的记忆管理系统,阻碍了长上下文推理、持续个性化和知识一致性的发展。现有模型主要依赖静态参数和短暂的上下文状态,限制了它们在长期跟踪用户偏好或更新知识的能力。
大型语言模型中记忆系统的演进过程,强调了从定义与探索阶段,到类人记忆发展阶段,再到基于工具的记忆管理阶段的进展。
为应对这一挑战,MemTensor与一众高校联合提出并开源了MemOS:
核心理念:MemOS(MemoryOperatingSystem)是一个为AI系统设计的记忆操作系统,将记忆视为可管理的系统资源,统一了明文、基于激活的和参数级记忆的表示、调度和演化,实现成本高效的存储和检索。
基本单元——MemCube:MemCube是MemOS中的基本记忆单元,封装了记忆内容和元数据(如来源和版本),支持组合、迁移和融合,使记忆类型之间能够灵活转换,并弥合检索与基于参数的学习之间的差距。
MemOS采用三层架构,包括接口层、操作层和基础设施层。接口层负责与用户或上游系统交互,提供标准化的记忆API;操作层负责组织和调度记忆资源;基础设施层处理记忆数据的存储、安全、迁移和流动。
记忆类型:系统化了三种核心记忆类型——明文记忆、激活记忆和参数记忆,分别对应不同的记忆内容和特性,并支持它们之间的无缝转换和统一调度。
关键模块:
MemReader:将自然语言输入解析为结构化的记忆操作链。
MemScheduler:根据任务意图和上下文动态选择记忆类型,并规划调用顺序和集成策略。
MemLifecycle:跟踪记忆单元的生命周期状态,确保记忆资源的可控性和新鲜度。
MemGovernance:负责记忆访问控制、合规性执行和审计性,确保记忆在多用户协作和长时任务推理中的安全性、可解释性和可控性。
整体评估:在LOCOMO基准测试中,MemOS在所有推理任务上均达到最佳性能,明显优于其他基线方法(如mem0、LangMem、Zep和OpenAI-Memory),尤其在多跳和时间推理等具有挑战性的场景中表现突出。
记忆检索评估:MemOS在不同记忆配置下的延迟和生成质量方面均表现优异,其检索时间接近较小的基线方法,但LLM评分却超过了全上下文基线,显示出其在混合语义组织和基于激活的记忆加载方面的优势。
KV记忆加速评估:通过将频繁访问的明文记忆转换为KV格式的激活记忆,MemOS在多个模型和配置下显著降低了首次响应延迟,且输出序列与直接提示注入方法完全一致,验证了其语义等价性。
MemOS:AMemoryOSforAISystemhttps ://arxiv. org/pdf/2507. 03724https ://github. com/MemTensor/MemOS
推荐阅读
•动手设计AIAgents:(编排、记忆、插件、workflow、协作)
•DeepSeekR1+Agent的下半场
•单智能体(Agent):企业员工AI助理
•Agent到多模态Agent再到多模态Multi-Agents系统的发展与案例讲解(1. 2万字,20+文献,27张图)
欢迎关注我的公众号“PaperAgent”,每天一篇大模型(LLM)文章来锻炼我们的思维,简单的例子,不简单的方法,提升自己。


文章作者: ZejunCao
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 ZejunCao !
  目录