MemOS：一种用于 AI 应用的记忆操作系统

发布日期: 2025-07-11

仅用于站内搜索，没有排版格式，具体信息请跳转上方微信公众号内链接

大型语言模型（LLM）已成为通用人工智能（AGI）的重要基础设施，然而其缺乏明确定义的记忆管理系统，阻碍了长上下文推理、持续个性化和知识一致性的发展。现有模型主要依赖静态参数和短暂的上下文状态，限制了它们在长期跟踪用户偏好或更新知识的能力。
大型语言模型中记忆系统的演进过程，强调了从定义与探索阶段，到类人记忆发展阶段，再到基于工具的记忆管理阶段的进展。
为应对这一挑战，MemTensor与一众高校联合提出并开源了MemOS：
核心理念：MemOS（MemoryOperatingSystem）是一个为AI系统设计的记忆操作系统，将记忆视为可管理的系统资源，统一了明文、基于激活的和参数级记忆的表示、调度和演化，实现成本高效的存储和检索。
基本单元——MemCube：MemCube是MemOS中的基本记忆单元，封装了记忆内容和元数据（如来源和版本），支持组合、迁移和融合，使记忆类型之间能够灵活转换，并弥合检索与基于参数的学习之间的差距。
MemOS采用三层架构，包括接口层、操作层和基础设施层。接口层负责与用户或上游系统交互，提供标准化的记忆API；操作层负责组织和调度记忆资源；基础设施层处理记忆数据的存储、安全、迁移和流动。
记忆类型：系统化了三种核心记忆类型——明文记忆、激活记忆和参数记忆，分别对应不同的记忆内容和特性，并支持它们之间的无缝转换和统一调度。
关键模块：
MemReader：将自然语言输入解析为结构化的记忆操作链。
MemScheduler：根据任务意图和上下文动态选择记忆类型，并规划调用顺序和集成策略。
MemLifecycle：跟踪记忆单元的生命周期状态，确保记忆资源的可控性和新鲜度。
MemGovernance：负责记忆访问控制、合规性执行和审计性，确保记忆在多用户协作和长时任务推理中的安全性、可解释性和可控性。
整体评估：在LOCOMO基准测试中，MemOS在所有推理任务上均达到最佳性能，明显优于其他基线方法（如mem0、LangMem、Zep和OpenAI-Memory），尤其在多跳和时间推理等具有挑战性的场景中表现突出。
记忆检索评估：MemOS在不同记忆配置下的延迟和生成质量方面均表现优异，其检索时间接近较小的基线方法，但LLM评分却超过了全上下文基线，显示出其在混合语义组织和基于激活的记忆加载方面的优势。
KV记忆加速评估：通过将频繁访问的明文记忆转换为KV格式的激活记忆，MemOS在多个模型和配置下显著降低了首次响应延迟，且输出序列与直接提示注入方法完全一致，验证了其语义等价性。
MemOS:AMemoryOSforAISystemhttps ://arxiv. org/pdf/2507. 03724https ://github. com/MemTensor/MemOS
推荐阅读
•动手设计AIAgents：（编排、记忆、插件、workflow、协作）
•DeepSeekR1+Agent的下半场
•单智能体（Agent）：企业员工AI助理
•Agent到多模态Agent再到多模态Multi-Agents系统的发展与案例讲解（1. 2万字，20+文献，27张图）
欢迎关注我的公众号“PaperAgent”，每天一篇大模型（LLM）文章来锻炼我们的思维，简单的例子，不简单的方法，提升自己。