四个软件三个步骤搭建本地知识库

发布于 2026-06-10

672

版权声明

我们非常重视原创文章，为尊重知识产权并避免潜在的版权问题，我们在此提供文章的摘要供您初步了解。如果您想要查阅更为详尽的内容，访问作者的公众号页面获取完整文章。

查看原文：四个软件三个步骤搭建本地知识库

文章来源：

麦哲思科技任甲林

扫码关注公众号

扫码阅读

手机扫码阅读

文章主旨：

本文详细指导如何利用开源工具（Ollama、BGE-M3、Qwen2.5、AnythingLLM）在本地搭建一套完全离线、免费的RAG知识库系统，实现基于私有文档的智能问答，并强调原始资料质量是系统有效性的基石。

关键要点：

RAG系统由四个核心组件组成：AnythingLLM（编排框架）、BGE-M3（嵌入模型）、Qwen2.5（大语言模型）、Ollama（模型运行引擎），缺一不可。
BGE-M3是中文嵌入模型的优选，支持多语言、长上下文（8192 token）和多种检索策略，避免跨语言混淆。
Qwen2.5（7B参数）是本地部署最佳中文LLM之一，支持128K上下文，开源免费，适合普通硬件。
搭建流程包括安装Ollama、下载bge-m3和qwen2.5模型、安装AnythingLLM、配置嵌入模型和对话模型、创建工作区并上传文档。
参数调优（文本块大小512-1024、重叠50-100、相似度阈值0.5、Top K 4-6）影响检索效果，修改后需重新上传文档。

内容结构：

引言：指出企业历史资料的价值，引出RAG系统的本地化解决方案。
系统架构：用表格展示四个组件的角色和职责，强调Ollama作为模型运行引擎的必要性。
组件选型理由：
- AnythingLLM（开箱即用、多格式支持、本地优先、工作区隔离）。
- BGE-M3（多语言性、多粒度性、多功能性）。
- Qwen2.5（中文原生、超长上下文、开源免费、轻量可选）。
- Ollama（统一管理、硬件适配、API兼容、轻量高效）。
完整搭建流程（Mac OS）：
- 安装Ollama并下载bge-m3和qwen2.5模型。
- 安装AnythingLLM。
- 配置嵌入模型（必须用bge-m3，不能用LLM替代）和对话模型（qwen2.5）。
- 创建工作区，上传文档。
参数调优指南：表格列出文本块大小、重叠、相似度阈值、Top K的推荐值和调优方向，并提醒修改后需重新上传文档。
结论：强调工具系统的“智商”依赖于原始资料的质量，避免“垃圾进，垃圾出”。

文章总结：

本文是一份实用的本地RAG系统搭建指南，强调组件选型、配置细节和资料质量的重要性，适合希望安全、低成本地利用私有文档进行智能问答的用户。

麦哲思科技任甲林

查看原文：四个软件三个步骤搭建本地知识库

文章来源：

麦哲思科技任甲林

扫码关注公众号

相关推荐

程序员防御性编程：代码背后的迷雾与智慧

1587

代码编程程序员防御性

在当前的“开猿节流”浪潮下，程序员们面临着前所未有的职业挑战。

SpringMVC 九大组件之 ViewResolver 深入分析

1358

放假啦～

温习数据算法—贪吃蛇

1520

食物坐标 .position 贪吃蛇

温习数据算法—贪吃蛇\x0a理解游戏中面向对象和由局部到整体的思想。

震惊！Windows Service服务和定时任务框架quartz之间原来是这种关系……

2139

执行触发器创建 10

前言：项目开发完成后，对接的项目有很多个模块，由于其中的一个环节疏忽，现在需要在原有的基础上把缺失的数据自动

零基础入门AI智能体：详细介绍输入节点、输出节点、快捷指令

97

输出节点输入对话

点击蓝字，关注我们这篇文章，我们将以“介绍一本

冷思考：99%的软件工程师会原地解散吗？

325

AI 代码工程师初级

我们不能阻止AI的浪潮，但我们可以选择如何去驾驭它。

麦哲思科技任甲林

麦哲思科技（北京）有限公司总经理敏捷性能合弄模型评估师认证的Scrum Master 认证的大规模敏捷顾问SPC CMMI高成熟度主任评估师 COSMIC MPC,IAC 成员，中国分部主席

471 篇文章

浏览 927.8K

还在用多套工具管项目？

一个平台搞定产品、项目、质量与效能，告别整合之苦，实现全流程闭环。

麦哲思科技任甲林的其他文章

如何把简单的事情一次做对？

在工作中领导最讨厌的人就是总把简单的事情做错的下属，在绝大多数人不会犯错的地方犯错，在领导眼中会判定为是基本素质问题，是不可原谅的。如果组织要裁员，那优先裁掉的就是哪些总是犯低级错误的人。那如何确保能够把简单的事情一次做对，提升自己的职场竞争力呢，请参考如下的七步工作。

单元测试技术培训练习总结报告

培训日期：2007年9月14日到2007年9月15日日程安排：第1天:上午：单元测试的技术与方法培训下午：LINUX下CUNIT单元测试工具的使用方法第2天：上午：分组练习下午：分组练习练习总结练习情况概述：约50名开发人员参加了练习，分成了7个小组进行了练习，其中一个小组原来采用C#在windows开发平台下进行软件开发，其他小组均是在LINUX环境下用C语言开发。练习均在实际的工作环境中进行的

四种测试层次的比较

名称测试对象侧重点参照物充分性的评价方法时机测试方法测试执行者单元测试软件的最小单元，如函数、方法等逻辑的正确性详细设计、源程序代码、分支等覆盖率软件中的基本组成单位完成后，边开发边测试白盒测试、动态测试一般是开发人员集成测试软件的模块、子系统接口的正确性概要设计、详细设计接口覆盖率软件系统集成过程中，边集

软件开发的质量红线

质量红线是我的一个客户提出的概念，即质量管理的底线、最低要求、最低标准，无论在什么情况下，项目都不能违背这个底线，比如项目组在进行多快好省四个要素平衡时，无论如何平衡，都不能违背质量的最低要求。我认为这个名词很直观形象，因此借用一下。在定义质量红线时应该从质量的投入与质量的产出两个方面进行定义。质量的投入如：评审投入的工作量；

和任老师聊聊质量工作

2019年10月12日在厦门有某公司的6位质量管理同仁一起共进晚餐，席间讨论多个话题。10月14日，这些有心的朋友整理了问答记录，我做了简单修订，摘录如下：SQA感觉成天统计数据，没什么意义？统计数据可以，对于SQA来说，要掌握数据分析方法，从数据中找出规律，得到结论，有明确的结论来影响大家。有数据，必须有结论，这样才能充分发挥数据的价值。比如...

随机阅读

刻意设计体验，才能带来更好的改变-读《行为设计学：打造峰值体验》

敏捷史话（十一）：敏捷宣言“间谍”——Steve Mellor

敏捷史话（六）：也许他可以拯救你的代码 —— Robert C. Martin

Martin Fowler | 敏捷的忠实拥护者

simps/mqtt：适用于 PHP 的 MQTT 协议解析和协程客户端

加入社区微信群

与行业大咖零距离交流学习

PMO实践白皮书
白皮书上线

联系我们
电话：4006 8899 23 邮箱：beining@chandao.com
融实践库
关于我们加入我们
微信号：rongpmcom
立即学习
微信公众号
微信视频号
社区微信群

友情链接：禅道项目管理软件云禅道敏捷开发喧喧IM ZDOO协同办公 ZTF自动化测试框架 ZenData测试数据生成器 ZenDAS数据分析渠成企业软件百宝箱 ZenShot开源截图工具 ZenPanel服务控制面板敏捷咨询