深度解析AI的记忆机制，Hermes的自我进化机制和Skill是记忆的延伸。

记忆 AI 上下文 Skill L4

发布于 2026-06-11

190

版权声明

我们非常重视原创文章，为尊重知识产权并避免潜在的版权问题，我们在此提供文章的摘要供您初步了解。如果您想要查阅更为详尽的内容，访问作者的公众号页面获取完整文章。

查看原文：深度解析AI的记忆机制，Hermes的自我进化机制和Skill是记忆的延伸。

文章来源：

Becomewiser

扫码关注公众号

扫码阅读

手机扫码阅读

文章主旨：AI的记忆并非人类式的持续认知，而是一套由会话窗口、压缩摘要、可检索档案和长期记忆四层独立工程机制组合而成的系统，理解这套机制是解决AI“失忆”问题的关键。

关键要点：

AI记忆分为四层：L1会话窗口（当前对话上下文）、L2压缩摘要（上下文饱和时对历史总结）、L3可检索档案（所有历史对话存储与检索）、L4长期记忆（用户主动要求或系统提炼的持久规则）。
L1和L2管理当前会话，其核心是上下文窗口管理策略（如Hermes在50%使用量时主动压缩）与压缩带来的细节丢失代价。
L3通过存储对话记录并在需要时按时间或语义检索，实现跨会话回忆；失忆的常见原因是存储、检索或上下文加载三环节之一断裂。
L4以极少量稳定信息（如用户偏好、项目规则）自动注入每次对话，但每一条都会挤占上下文空间，因此核心挑战是筛选该存什么。
AI“记得你”的体验来自两类工程机制：每次对话均注入的系统提示/L4等固定内容，以及按需触发的L3检索+上下文注入；Skill（如Hermes的自我进化）将长尾经验从规则中分离，实现按需加载而不浪费上下文。

内容结构：

记忆的产生与工程本质
指出AI记忆不同于人类，是每次对话重新“认识”用户；记忆是AI产品个性化的基础，本质是工程问题。
记忆的四层架构
引用原文表格说明L1至L4的名称、本质：L1会话窗口、L2压缩摘要、L3可检索档案、L4长期记忆；强调四层解决不同问题、实现方式不同，不可混为一谈。
L1与L2的工作机制
详细解释上下文窗口原理、压缩触发策略（如Hermes的50%阈值）、压缩带来的细节丢失；L1/L2管理当前会话。
L3可检索档案的工作机制
解释存储、检索、上下文注入三步流程，以OpenClaw为例说明按时间缩小范围+语义匹配；列出失忆的三大排查环节。
L4长期记忆的工作机制
说明长期记忆是核心认知和规则，自动注入每次对话；核心挑战是筛选而非存储量，过多记忆会干扰当前任务。
四层独立性
强调L2的总结不会自动进入L4，设计Agent时需分层治理。
记忆“想起你”的体验来源
解释每次对话模型读取的两类内容：固定注入（系统提示、L4等）与按需检索（L3检索+上下文注入）；Skill/MCP属于按需加载范畴。
Skill作为记忆的延伸与自我进化
以Hermes为例说明Skill能将任务失败经验自动成Skill并在后续按需调用；对比规则（全局执行）与Skill（按需使用）的职责划分；提示构建Agent时需区分系统提示词、全局规则、Skill三者边界，并给出决策问题。
结论
用工程视角总结AI记忆：注意力机制是计算架构，上下文窗口是信息边界，写入是提取规则，检索是索引排序；AI“失忆”不是变笨，而是工程链条断裂；最后以“AI：很高兴重新认识你”收束。