上下文窗口越大越好吗

上下文信息检索塞进去文档

发布于 2026-06-09

134

版权声明

我们非常重视原创文章，为尊重知识产权并避免潜在的版权问题，我们在此提供文章的摘要供您初步了解。如果您想要查阅更为详尽的内容，访问作者的公众号页面获取完整文章。

查看原文：上下文窗口越大越好吗

文章来源：

Python学习杂记

扫码关注公众号

扫码阅读

手机扫码阅读

文章主旨：

长上下文窗口并非越大越好，其会带来计算成本高、质量下降和噪声干扰等问题，需要通过检索、摘要压缩和合理放置信息等手段有效利用。

关键要点：

上下文窗口增大带来三个主要成本：计算成本（自注意力复杂度O(n²)）、质量下降（Lost in the Middle现象导致中间信息被忽略）、噪声干扰（无关信息影响判断）。
长上下文适用于长文档问答、代码库分析、长对话历史等场景，但更好的做法是先用检索或摘要压缩，而非全部塞入。
长上下文的正确用法包括：RAG+长上下文结合、信息前置或后置、使用摘要压缩历史对话。
实际案例对比显示，纯长上下文方案准确率65%、费用高；检索+长上下文方案准确率95%、费用低，效果最佳。
结论：长上下文是工具而非万能药，需根据场景谨慎使用，避免过度依赖。

内容结构：

1. 问题的提出

大模型上下文窗口越来越大（GPT-4 128K、Claude 200K、Gemini 1M），但并非越大越好。

2. 三个成本详解

成本一：计算成本 - 注意力机制计算量O(n²)，从4K到128K计算量增加约1000倍，导致推理时间和API费用上升。

成本二：质量下降 - “Lost in the Middle”现象，大模型更关注上下文开头和结尾，中间信息易被忽略。

成本三：噪声干扰 - 长上下文包含大量无关信息，干扰模型判断。

3. 何时需要长上下文

列举三个场景：长文档问答、代码库分析、长对话历史。指出更好的做法是使用检索或摘要压缩。

4. 正确使用方法

方法一：RAG+长上下文结合，先用向量检索相关文档再塞入。

方法二：信息前置或后置，将重要信息放在开头或结尾。

方法三：摘要压缩，用大模型生成早期对话摘要，保留近期完整对话。

5. 实际对比案例

法律问答系统处理200页合同查找违约条款：纯长上下文（准确率65%，费用$2/次）；仅检索（准确率92%，费用$0.1/次）；检索+长上下文结合（准确率95%，费用$0.3/次）。

6. 总结

上下文窗口不是越大越好，正确做法是用检索筛选信息、摘要压缩历史、重要信息放开头或结尾。长上下文是工具而非万能药。

文章总结：

文章理性分析了长上下文窗口的利弊，强调通过检索与摘要的组合使用来平衡成本与效果，建议开发者根据实际场景谨慎选择上下文长度，避免盲目追求大窗口。

Python学习杂记

查看原文：上下文窗口越大越好吗

文章来源：

Python学习杂记

扫码关注公众号

相关推荐

Flask 上下文是什么？

1367

上下文请求 Flask 线程

今天我们来聊聊什么是 Flask 上下文

DDD你真的理解清楚了吗（4）上下文

1682

业务上下文划分订单

DDD你真的理解清楚了吗？其中一个最大的难题是限界上下文该怎么划分，今天我们就来探讨一下吧

深度解析三大 Agent 上下文工程：Claude Code、OpenClaw、Hermes 的设计哲学

177

上下文压缩模型 AI

AI时代不仅止于技术创新，还在于把技术上的创新点以一个用户可感知的方式展示了出来。

透过Claude code源码分析，看CC如何做好Harness Engineering的？

110

冲突 Agent 上下文 Skill

这正是 CC 教给我们的：做好 Agent，先做好 Harness Engineering。

上下文工程的第一性原理：一场“恰到好处”的驾驭艺术

130

上下文智能工程模型

打磨那一份“恰到好处”，才是通向 AGI 工业化应用的最优解

Claude Code泄露代码深度解析（大量工程内幕和新功能首次曝光）

254

Agent 记忆上下文 SubAgent

Anthropic的一次打包失误，让全球开发者得以一窥当前最顶级的AI编程助手的工程细节

Python学习杂记

探索运筹优化、机器学习、AI 和数据可视化的奥秘及其落地应用

280 篇文章

浏览 409.2K

还在用多套工具管项目？

一个平台搞定产品、项目、质量与效能，告别整合之苦，实现全流程闭环。

Python学习杂记的其他文章

Python编程常用的36个经典案例

Python 的简洁和强大使其成为许多开发者的首选语言。本文将介绍36个常用的Python经典代码案例。

Python字符串拼接常用的6种方法

在Python编程中，字符串拼接是一个常见的操作。Python提供了多种方式来连接字符串，本文将介绍6种不同的字符串拼接方法，帮助大家更好地理解字符串相关操作。

Python常用统计库Statsmodels介绍

Statsmodels是一个广泛使用的Python库，用于实现统计模型估计和推断。

jupyter扩展插件安装和使用

jupyter notebook是一款Python经常使用的IDE工具,其扩展插件Nbextension

条件语句的几种经典写法

假如要写一个简单函数，该函数需要根据年龄来判断这个人是成年还是未成年。这一个简单的函数可以有很多种写法，每一

随机阅读

谷歌的代码覆盖率最佳实践

精益，已经过时了吗？

十数年后，再读《搞定》

沃尔玛的故事，读《富甲美国》

人间值得，请别放弃

加入社区微信群

与行业大咖零距离交流学习

PMO实践白皮书
白皮书上线

联系我们
电话：4006 8899 23 邮箱：beining@chandao.com
融实践库
关于我们加入我们
微信号：rongpmcom
立即学习
微信公众号
微信视频号
社区微信群

友情链接：禅道项目管理软件云禅道敏捷开发喧喧IM ZDOO协同办公 ZTF自动化测试框架 ZenData测试数据生成器 ZenDAS数据分析渠成企业软件百宝箱 ZenShot开源截图工具 ZenPanel服务控制面板敏捷咨询