深度解析三大 Agent 上下文工程:Claude Code、OpenClaw、Hermes 的设计哲学
版权声明
我们非常重视原创文章,为尊重知识产权并避免潜在的版权问题,我们在此提供文章的摘要供您初步了解。如果您想要查阅更为详尽的内容,访问作者的公众号页面获取完整文章。
Becomewiser
扫码关注公众号
扫码阅读
手机扫码阅读
上下文工程是什么?
持久的记忆:Openclew的Soul,模型的记忆Memory全局的规则:CLAUDE.md、AGENTS.md系统提示词System Prompt:AI的工作说明用户提示词User Prompt:用户的输入,以及我们帮助用户注入的变量。MCP、Function等工具的描述信息工具调用返回的结果近x轮的对话历史压缩后的摘要……
Context refers to the set of tokens included when sampling from a large-language model (LLM). The engineering problem at hand is optimizing the utility of those tokens against the inherent constraints of LLMs in order to consistently achieve a desired outcome. Effectively wrangling LLMs often requires thinking in context — in other words: considering the holistic state available to the LLM at any given time and what potential behaviors that state might yield. Effective context engineering for AI agents
- Write,把信息分门别类记录,例如记忆、状态写到窗口外面
- Select,按需选择信息,包括工具、记忆、知识库
- Compress,总结、裁剪上下文,保留高价值的信息
- Isolate,隔离上下文,不同agent使用不同的内容
- 模型的窗口有上限
文件读取、工具输出、推理过程、输出结果会迅速累积,不仅很快会触发上限,也会因为大量的噪音影响到模型的推理。 - 随着上下文变长会变笨
随着上下文变长,模型的表现会变差,内容越多注意力就会变差,就像我们也很难从800字里迅速的找到某句话。 - 上下文越长会越贵、速度越慢
过多默认注入的内容不仅会抬高 token 成本,也会让模型响应更慢,而且重复发送大段上下文本身就是一笔持续成本。 - 新会话信息丢失
在不同的窗口,其实模型是不会主动记住上次发生了什么除非是我们要求它记住。 - 工具噪音
日志、文件内容、搜索结果会吞掉真正重要的推理空间。
Claude Code:渐进式上下文压缩
OpenClaw:极度开放的上下文框架
Hermes:把交接当成常态
给我们做 Agent 的 5 条设计启发
Becomewiser
Becomewiser
扫码关注公众号
还在用多套工具管项目?
一个平台搞定产品、项目、质量与效能,告别整合之苦,实现全流程闭环。
查看方案
Becomewiser的其他文章
加入社区微信群
与行业大咖零距离交流学习
PMO实践白皮书
白皮书上线
白皮书上线