完整RAG工作流达成!手把手教你使用NAS部署企业生产级AI知识库

📅 2026/7/6 4:02:51 👁️ 阅读次数 📝 编程学习
完整RAG工作流达成!手把手教你使用NAS部署企业生产级AI知识库

完整RAG工作流达成!手把手教你使用NAS部署企业生产级AI知识库

哈喽小伙伴们好,我是Stark-C~

之前给小伙伴们分享过多个可在NAS上私有化部署的知识库项目,不过这些方案大多还是偏向于个人用户。虽说简单好用,上手简单,但深度不够,如果是用作企业生产级,比如说满足复杂文档解析、结构化切片、多路检索、重排、引用溯源、模型治理这些需求,之前介绍的那些知识库项目还是差点意思。

所以今天就给大家分享一个从底层架构就奔着企业级场景去设计的全能 RAG AI引擎--RAGFlow。用它来部署企业生产级知识库,不仅能解决传统轻量工具在解析、切片、检索、溯源等方面的短板,还能把模型管理、数据源同步、Agent 工具调用等能力整合到统一工作流中,真正做到“生产可用”。

话不多说,直接带大家整起来!

关于RAGFlow

🔺RAGFlow 是 Infiniflow 开源的一体化 RAG(Retrieval-Augmented Generation)引擎,目前已经在G站获得超过83.3k 的Star支持!这个项目并不是简单的向量库 + LLM 拼装,而是整合了“深度文档理解 + 可控切片 + 多路检索 + 可追溯引用 + 强大 UI + Agent 能力 + 企业级数据源连接”的全能 RAG 引擎,为企业提供知识库、智能客服、内部检索高质量、可验证、可调试 的 AI 工作流!

项目Github地址:https://github.com/infiniflow/ragflow

项目亮点特色:

  • 1,深度文档理解:RAGFlow能通过视觉模型解析复杂文档,包括PDF、Word / PPT / Excel、图片、网页内容等,它不仅 OCR,还能识别标题层级、段落结构、表格、图文关系。

  • 2,模板化切片:它提供了针对书籍、论文、简历等不同内容类型的解析模板,并利用NLP技术进行语义感知分块,避免机械切割导致的上下文断裂、检索命中但上下文不完整等问题。

  • 3,可追溯引用:RAGFlow的回答可以精确定位到原文片段,并提供可视化的 chunk 展示,让用户知道答案来自哪里。

  • 4,多路检索 + 重排:RAGFlow内置多策略检索、重排、多模型召回,相比“向量库 + LLM”的简单方案,它能显著提升召回质量与答案准确性。

  • 5,强大的模型管理:RAGFlow拥有广泛的模型支持,原生支持集成Ollama(本地模型)、OpenAI、Azure、Claude(Anthropic)等多种大语言模型。

  • 6,内置 Agent 系统:它还内置了可视化工作流引擎,允许用户通过拖拽方式定义复杂的知识处理流程。这能实现如多跳推理(分解复杂问题)和异构数据融合(联合检索数据库和文档)等高级功能。

RAGFlow部署

1,部署的前提条件:

🔺RAGFlow的私有化部署对硬件是有要求的,必须满足:

  • CPU:≥ 4 核

  • 内存:≥ 16 GB

  • 硬盘:≥ 50 GB

  • Docker:版本 ≥ 24.0.0

  • Docker Compose:版本 ≥ v2.26.1

我今天为大家演示的NAS为威联通Qu605,六盘位大容量,使用的是低功耗4核4线程的N150处理器,标配16GB DDR5内存,所以用来部署RAGFlow是完全没有任何问题的。

2,开始部署:

提前说明:部署之前需要搞定网络,全程都需要有【互联网】的支持!!!

🔺先在Docker目录中(威联通默认的Docker目录为“Container")新建一个“RagFlow”的文件夹

🔺然后开启威联通NAS的SSH连接(位置在“控制台--网络和文件服务--Telnet/SSH”)。

🔺然后随意使用一个终端工具连接到威联通NAS(本文演示的工具为“FinalShell”)。连上之后先通过“sudo -i”命令提权,接着输入密码,这里的密码就是NAS的登录密码,输入密码没有显示,输完之后直接回车即可。

🔺此界面直接输入“Q”回车。

🔺此界面输入“Y”回车。

🔺然后依次执行以下命令:

  • cd /share/Container/RagFlow # 进入NAS 的RagFlow目录(具体以你自己的实际文件夹而定)

  • git clone https://github.com/infiniflow/ragflow.git #从 GitHub 把 RagFlow 项目下载到当前目录

🔺然后回到威联通的文件管理器,打开设置,将“显示NAS的隐藏文件”开启。(终端工具不要关了)

🔺接着打开“RagFlow--ragflow--docker”目录,选中“.env”文件右键,选择“重命名”。

🔺将它重命名为“.txt”。

🔺然后直接点开重命名后的“.txt”文件。威联通默认会通过Text Editor文本管理器打开(如果没有就直接去应用商店安装),我们需要做的就是将这里面和本地有冲突的端口(也就是“PORT”后面的数字)全部修改成不冲突的即可,特别是我图中标出来的“SVR_WEB_HTTP_PORT”以及“SVR_WEB_HTTPS_PORT”是必改端口。完成之后点击右上角的“文件--保存”即可。

🔺然后回到文件管理器,将“.txt”文件重新重命名为“.env”即可。

🔺接着再回到终端工具这边,依次执行以下命令:

  • cd ragflow # 进入 ragflow 文件夹

  • docker compose -f docker/docker-compose.yml up -d # 用 docker-compose 启动 ragflow

然后系统就会自动拉取 ragflow 所需的Docker镜像,这个时候请务必保持畅通的【互联网】。我这边因为之前所需的镜像已经提前拉取到本地,所以这里是直接启动程序了。

🔺完成之后回到威联通的Container Station中,可以看到RAGFlow总共运行了5个相关容器。

RAGFlow体验

🔺RAGFlow的主程序容器为“docker-ragflow-cpu-1”,点开这个容器之后,80端口映射的就是它的Web页面打开端口。(其实就是我们在“.env”中修改的“SVR_WEB_HTTP_PORT”端口)

🔺刚打开的时候会看到502报错,这是正常的,因为此时mysql数据库还没有跑起来。

🔺稍等一会(大概一分钟左右),该页面会自动打开登录页面,就说明所有的工作准备就绪,可以使用了。我们先点“Sign up”注册一个账号。

🔺注册很简单,随便设置一个邮箱、用户名,以及用户密码即可。

🔺然后使用注册的邮箱和密码登录。

🔺登录进来后可以先将语言设置为简体中文。

🔺还可以切换主题模式。

🔺点击右上角的用户图标先来设置AI大模型。

🔺在“模型提供商”里可以看到它提供的模型服务商挺多的,甚至还内置了硅基流动这种综合类多模态模型服务商。

🔺我这里就以硅基流动为例,直接粘贴API-Key之后就可以了。

🔺像硅基流动这种综合类 AI 大模型提供商最大的好处,就是一个 API Key可以使用多种不同类型的大模型,从对话、嵌入,到图像理解、视频分析、语音识别、结构化抽取、Rerank 重排等全链路能力都能统一调用,大幅降低了接入成本。

PS:硅基流动拥有极其丰富的模型矩阵,包括语言、图像 、 视频 、语音等均有涉及。硅基流动目前有活动,所有用户在注册后首次完成有效实名认证,即可获得1 张面值 ¥16 的全站通用「认证奖励券」 ,之后就能免费体验一段时间任意大模型。活动可以通过官网,或者我的邀请链接【https://cloud.siliconflow.cn/i/BsoAsvvg】获取。

🔺简单演示下创建知识库。选择首页的“知识库”之后再点“添加”按钮。

🔺为知识库命名,然后选中一个嵌入模型就可以了。

🔺创建好之后就可以上传文件。

🔺文件是以拖拽上传的形式,支持多个单个文件一起上传,也支持直接上传文件夹。我这里直接上传了我平时创作的Markdown文件夹。

🔺上传之后这里会以列表的形式呈现,并且我在上步勾选了“创建时解析”,实测解析的速度还是挺快的,6篇文章不到一分钟全部解析完成。

🔺随便点开一个可以看到是完美识别的,并且还有切片效果。

🔺我个人比较喜欢它的知识图谱,它会根据我们上传的所有文章自动抽取关键概念、实体与关系,并将它们组织成一张可视化的知识结构网络,让我们一眼就能看到哪些内容是相关的、哪些主题是核心。

🔺聊天的时候如果想优先启用知识库,需要在设置中奖我们的知识库手动添加进来。

🔺这样我们在提问时,它就会自动关联知识库内容,给出经过检索与理解后的精准回答。

总结

我文中展示的只是RAGFlow最最基础的功能,因为我个人其实是用不到这么强大的知识库管理系统,所以只挑了最容易上手的部分来演示。至于其它至于其它那些真正面向企业级的高级能力,比如核心的多策略检索与重排、复杂文档的结构化解析灯功能,就留给真正需要的小伙伴自行挖掘吧~

好了,以上就是今天给大家分享的内容,我是爱分享的Stark-C,如果今天的内容对你有帮助请记得收藏,顺便点点关注,咱们下期再见!谢谢大家~