如何用自然语言构建专属RAG智能体:5分钟快速上手指南

📅 2026/7/3 2:30:15 👁️ 阅读次数 📝 编程学习
如何用自然语言构建专属RAG智能体:5分钟快速上手指南

如何用自然语言构建专属RAG智能体:5分钟快速上手指南

【免费下载链接】ragsBuild ChatGPT over your data, all with natural language项目地址: https://gitcode.com/gh_mirrors/ra/rags

RAGs是一款基于Streamlit开发的应用程序,能够让你通过自然语言从数据源创建RAG(检索增强生成)管道。无需复杂编程知识,只需简单几步,就能快速构建属于自己的智能问答系统,让ChatGPT等大语言模型能够基于你的私有数据进行回答。

🌟 RAG智能体的核心优势

传统的大语言模型虽然知识渊博,但无法访问你的私有数据。RAGs通过自然语言交互,让你轻松构建能够理解和处理个人或企业数据的智能体。它的核心优势包括:

  • 零代码门槛:全程使用自然语言描述需求,无需编写代码
  • 快速部署:从数据到智能体,整个过程仅需5分钟
  • 灵活配置:可自定义检索参数、模型选择等关键设置
  • 多源支持:目前支持本地文件和网页数据,未来将扩展更多数据源

🚀 快速安装与启动步骤

1. 克隆项目仓库

首先,将项目代码克隆到本地:

git clone https://gitcode.com/gh_mirrors/ra/rags cd rags

2. 创建并激活虚拟环境

推荐使用虚拟环境来管理项目依赖:

python3 -m venv .venv source .venv/bin/activate # Linux/Mac .venv\Scripts\activate # Windows

3. 安装依赖包

使用Poetry安装项目所需的所有依赖:

poetry install --with dev

4. 配置API密钥

默认情况下,RAGs使用OpenAI的模型。需要创建配置文件并添加API密钥:

mkdir -p .streamlit echo "openai_key = \"你的OpenAI密钥\"" > .streamlit/secrets.toml

5. 启动应用程序

一切准备就绪后,运行以下命令启动Streamlit应用:

streamlit run 1_🏠_Home.py

📊 三步构建专属RAG智能体

1. 🏠 首页设置:描述你的需求

在首页,你需要完成以下三个关键步骤:

  • 描述数据集:目前支持单个本地文件或网页链接
  • 描述任务:这些描述将用于初始化LLM的系统提示
  • 定义参数:设置RAG系统的典型参数

所有这些都可以通过自然语言完成,例如你可以输入"加载本地的pg_essay.txt文件,创建一个能够回答关于PostgreSQL文章内容的智能体,检索时返回5个相关文档"。

2. ⚙️ RAG配置:自定义你的智能体

配置页面会展示由"构建器智能体"生成的参数,你可以根据需要手动编辑:

  • 系统提示:指导智能体行为的核心指令
  • 包含摘要:是否添加摘要工具(而非仅进行top-k检索)
  • Top-K:检索相关文档的数量
  • Chunk Size:文本分块大小
  • 嵌入模型:用于生成文本嵌入的模型
  • LLM:用于生成回答的大语言模型

修改参数后,点击"Update Agent"按钮更新智能体。配置文件位于core/builder_config.py,你可以根据需要进行更高级的自定义。

3. 🤖 生成RAG智能体:开始对话

创建智能体后,你可以在生成的聊天界面中与智能体进行交互。它将能够选择合适的RAG工具(向量搜索或摘要)来回答你的问题。

🧩 支持的模型与嵌入

构建器智能体

默认使用OpenAI模型,定义在core/builder_config.py文件中。你可以将其自定义为任何LLM(提供了Anthropic的示例)。需要注意的是,GPT-4变体在构建智能体方面会提供最可靠的结果。

生成的RAG智能体

你可以通过自然语言或手动方式设置嵌入模型和LLM的配置:

  • LLM支持

    • OpenAI: ID格式为"openai:<模型名称>",如"openai:gpt-4-1106-preview"
    • Anthropic: ID格式为"anthropic:<模型名称>",如"anthropic:claude-2"
    • Replicate: ID格式为"replicate:<模型名称>"
    • HuggingFace: ID格式为"local:<模型名称>",如"local:BAAI/bge-small-en"
  • 嵌入模型:默认支持text-embedding-ada-002,也支持Hugging Face模型,使用时只需前缀"local:",如"local:BAAI/bge-small-en"。

💡 使用小贴士

如果在升级RAGs版本后遇到启动问题,可能需要删除主目录中的cache文件夹(不同版本之间可能引入了存储数据结构的破坏性更改)。

如果你没有看到"Update Agent"按钮,那是因为你尚未创建智能体,请返回"Home"页面完成设置过程。

🛠️ 项目结构概览

项目的核心代码位于core/目录,其中包含了智能体构建器、配置管理和工具函数等关键组件。用户界面通过pages/目录下的文件定义,包括RAG配置页面和生成的智能体页面。

📚 学习资源

如果遇到问题,可以提交GitHub issue或加入Discord社区获取帮助。该应用基于LlamaIndex Python构建,更多信息可以参考LlamaIndex的官方文档。

通过RAGs,任何人都可以轻松构建基于私有数据的智能问答系统,让AI真正为你的个人和业务需求服务。现在就开始尝试,5分钟后你就能拥有自己的RAG智能体!

【免费下载链接】ragsBuild ChatGPT over your data, all with natural language项目地址: https://gitcode.com/gh_mirrors/ra/rags

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考