如何用自然语言构建专属RAG智能体：5分钟快速上手指南

📅 2026/7/3 2:30:15 👁️ 阅读次数 📝 编程学习

如何用自然语言构建专属RAG智能体：5分钟快速上手指南

【免费下载链接】ragsBuild ChatGPT over your data, all with natural language项目地址: https://gitcode.com/gh_mirrors/ra/rags

RAGs是一款基于Streamlit开发的应用程序，能够让你通过自然语言从数据源创建RAG（检索增强生成）管道。无需复杂编程知识，只需简单几步，就能快速构建属于自己的智能问答系统，让ChatGPT等大语言模型能够基于你的私有数据进行回答。

🌟 RAG智能体的核心优势

传统的大语言模型虽然知识渊博，但无法访问你的私有数据。RAGs通过自然语言交互，让你轻松构建能够理解和处理个人或企业数据的智能体。它的核心优势包括：

零代码门槛：全程使用自然语言描述需求，无需编写代码
快速部署：从数据到智能体，整个过程仅需5分钟
灵活配置：可自定义检索参数、模型选择等关键设置
多源支持：目前支持本地文件和网页数据，未来将扩展更多数据源

🚀 快速安装与启动步骤

1. 克隆项目仓库

首先，将项目代码克隆到本地：

git clone https://gitcode.com/gh_mirrors/ra/rags cd rags

2. 创建并激活虚拟环境

推荐使用虚拟环境来管理项目依赖：

python3 -m venv .venv source .venv/bin/activate # Linux/Mac .venv\Scripts\activate # Windows

3. 安装依赖包

使用Poetry安装项目所需的所有依赖：

poetry install --with dev

4. 配置API密钥

默认情况下，RAGs使用OpenAI的模型。需要创建配置文件并添加API密钥：

mkdir -p .streamlit echo "openai_key = \"你的OpenAI密钥\"" > .streamlit/secrets.toml

5. 启动应用程序

一切准备就绪后，运行以下命令启动Streamlit应用：

streamlit run 1_🏠_Home.py

📊 三步构建专属RAG智能体

1. 🏠 首页设置：描述你的需求

在首页，你需要完成以下三个关键步骤：

描述数据集：目前支持单个本地文件或网页链接
描述任务：这些描述将用于初始化LLM的系统提示
定义参数：设置RAG系统的典型参数

所有这些都可以通过自然语言完成，例如你可以输入"加载本地的pg_essay.txt文件，创建一个能够回答关于PostgreSQL文章内容的智能体，检索时返回5个相关文档"。

2. ⚙️ RAG配置：自定义你的智能体

配置页面会展示由"构建器智能体"生成的参数，你可以根据需要手动编辑：

系统提示：指导智能体行为的核心指令
包含摘要：是否添加摘要工具（而非仅进行top-k检索）
Top-K：检索相关文档的数量
Chunk Size：文本分块大小
嵌入模型：用于生成文本嵌入的模型
LLM：用于生成回答的大语言模型

修改参数后，点击"Update Agent"按钮更新智能体。配置文件位于core/builder_config.py，你可以根据需要进行更高级的自定义。

3. 🤖 生成RAG智能体：开始对话

创建智能体后，你可以在生成的聊天界面中与智能体进行交互。它将能够选择合适的RAG工具（向量搜索或摘要）来回答你的问题。

🧩 支持的模型与嵌入

构建器智能体

默认使用OpenAI模型，定义在core/builder_config.py文件中。你可以将其自定义为任何LLM（提供了Anthropic的示例）。需要注意的是，GPT-4变体在构建智能体方面会提供最可靠的结果。

生成的RAG智能体

你可以通过自然语言或手动方式设置嵌入模型和LLM的配置：

LLM支持：
- OpenAI: ID格式为"openai:<模型名称>"，如"openai:gpt-4-1106-preview"
- Anthropic: ID格式为"anthropic:<模型名称>"，如"anthropic:claude-2"
- Replicate: ID格式为"replicate:<模型名称>"
- HuggingFace: ID格式为"local:<模型名称>"，如"local:BAAI/bge-small-en"
嵌入模型：默认支持text-embedding-ada-002，也支持Hugging Face模型，使用时只需前缀"local:"，如"local:BAAI/bge-small-en"。

💡 使用小贴士

如果在升级RAGs版本后遇到启动问题，可能需要删除主目录中的cache文件夹（不同版本之间可能引入了存储数据结构的破坏性更改）。

如果你没有看到"Update Agent"按钮，那是因为你尚未创建智能体，请返回"Home"页面完成设置过程。

🛠️ 项目结构概览

项目的核心代码位于core/目录，其中包含了智能体构建器、配置管理和工具函数等关键组件。用户界面通过pages/目录下的文件定义，包括RAG配置页面和生成的智能体页面。

📚 学习资源

如果遇到问题，可以提交GitHub issue或加入Discord社区获取帮助。该应用基于LlamaIndex Python构建，更多信息可以参考LlamaIndex的官方文档。

通过RAGs，任何人都可以轻松构建基于私有数据的智能问答系统，让AI真正为你的个人和业务需求服务。现在就开始尝试，5分钟后你就能拥有自己的RAG智能体！

【免费下载链接】ragsBuild ChatGPT over your data, all with natural language项目地址: https://gitcode.com/gh_mirrors/ra/rags

资讯详情

如何用自然语言构建专属RAG智能体：5分钟快速上手指南