72.人工智能实战:RAG 多路召回怎么做?从单一向量检索召回不足到 BM25、向量、标签与重排融合

📅 2026/7/3 8:01:44 👁️ 阅读次数 📝 编程学习
72.人工智能实战:RAG 多路召回怎么做?从单一向量检索召回不足到 BM25、向量、标签与重排融合

人工智能实战:RAG 多路召回怎么做?从单一向量检索召回不足到 BM25、向量、标签与重排融合


一、问题场景:向量检索很智能,但就是找不到关键文档

很多 RAG 系统最开始只用向量检索:

query → embedding → vector search → top_k docs

这个方案简单、通用,语义效果也不错。

但上线后会发现,有些问题向量检索并不稳定。

尤其是:

1. 专有名词 2. 编号 3. 制度条款 4. 产品型号 5. 人名 6. 缩写 7. 精确字段

例如用户问:

SOP-2026-IT-017 的发布审批流程是什么?

向量检索可能召回“发布流程概述”,但漏掉真正的:

SOP-2026-IT-017

再比如用户问:

销售客户拜访二线城市住宿费是多少?

向量检索可能召回“普通差旅制度”,因为语义上也很接近。

这类问题说明: