2023爱分析·知识库问答市场厂商评估报告:爱数

在这里插入图片描述

01 研究范围定义

研究范围:

大模型是指通过在海量数据上依托强大算力资源进行训练后能完成大量不同下游任务的模型。2023年以来,ChatGPT引爆全球大模型市场。国内众多大模型先后公测,众多互联网领军者投身大模型事业,使得大模型市场进入“百团大战”阶段,2023年成为公认的“大模型元年”。

企业用户方面,大模型的应用速度之快超乎想象。2023年初,企业管理层对大模型的话题还停留在大模型是什么,是不是概念炒作。短短半年,大模型已经从饭后谈资走向落地应用。大企业管理层们希望了解到大模型能为企业发展带来哪些变革,大模型的应用路径是什么,如何提升大模型的投资回报率,以及应该为拥抱大模型做哪些准备。而且,大模型吸引的人群也愈发广泛,不仅吸引CIO、CTO等技术管理者的关注,CEO、CMO等非技术类管理者同样期待大模型在业务中发挥价值。这些转变表明,大模型的变革之力正日益得到产业界的认可。

通过对市场规模数据的分析,能较为直观地体现出企业对大模型应用落地的热情。爱分析数据显示,2023年中国大模型市场规模约为50亿元(人民币,下同)。2023年,企业在大模型方面的采购特点是论证多、采购少,各企业计划在2024年开始大量释放大模型预算,因此市场规模将大幅增长,预计达到120亿元。

爱分析认为,大模型市场从技术架构角度可以划分为基础层、模型层、中间层和应用层。基础层是指为大模型训练推理而提供的基础环境,包括湖仓一体、向量数据库、智算中心、大模型安全流通平台等。模型层是指基础大模型以及微调后的大模型,包括通用大模型、行业大模型、领域大模型和企业大模型。中间层是模型层和应用层之间的“桥梁”,有利于大模型在各种实际场景快速落地,包括大模型应用开发工具、LLMOps工具等。应用层是指大模型应用和解决方案,包括知识库问答、智能客服、对话式分析等。大模型市场划分详见下图。
在这里插入图片描述

本评估报告聚焦知识库问答市场,爱分析遴选出具备成熟解决方案和成功案例的厂商,供企业做厂商选型时提供参考。同时,在该市场下,爱分析重点选取了知识库问答厂商爱数进行能力评估。

02 知识库问答市场分析

市场定义:

知识库问答是指将大模型与知识库相结合,改变原有的知识库构建、应用与运维的方式,致力于更好地支撑企业管理层及全体员工的知识检索与应用需求。

甲方终端用户:

企业管理层及全体员工

甲方核心需求:

成本可控、验证速度较快、覆盖的企业内部用户比较多等多重因素共同作用下,知识库成为大模型在企业落地的首选场景之一。从渗透情况来看,大模型在知识构建、知识校验和知识库应用三个环节渗透较深。

图1:知识库构建流程及大模型渗透情况
在这里插入图片描述

基于大模型在知识库场景的渗透情况,当前甲方对知识库问答主要有三项核心需求,一是压缩知识库冷启动时间,二是降低知识校验环节对人工的依赖,三是企业亟需解决幻觉问题。

压缩知识库冷启动时间。当前,知识构建工作比较依赖话术师,他们负责整理问答对和扩写相似问,此过程比较依赖他们的个人经验。一个话术师整理一类知识库通常需要耗费大约1-3 个月的时间。知识构建是知识库冷启动的核心环节,知识构建效率偏低会直接导致知识库冷启动时间比较长。企业需要借助大模型的理解能力和生成能力压缩知识库冷启动时间。引入大模型之后,可以提升问答对整理和相似问扩写的速度,甚至可以直接采用“大模型+文档库”的方式,实现更极致的冷启动压缩。
降低知识校验环节对人工的依赖。在完成知识构建后,企业需要校验知识准确性以及文法细节,此环节主要靠人工来实现。并且,该工作对相关人员的工作经验有较高要求。企业希望借助大模型实现自动化知识校验。
知识库交互方式变化,企业亟需解决幻觉问题,生成可信的答案。传统知识库主要采用人工检索方式,很难直接告诉用户答案,该交互方式比较低效。企业需要利用大模型的生成能力直接生成用户所需的答案。但是,交互方式的变化也为知识库应用带来新的挑战,即大模型幻觉导致的答案不可信。
厂商能力要求:

厂商需要满足三项能力要求,一是具备利用大模型进行知识分类、知识抽取和问答对拆分的能力,二是具备解决两个校验难题的方案,三是具备RAG、微调等缓解大模型幻觉的能力。

具备利用大模型进行知识分类、知识抽取和问答对拆分的能力。引入大模型之后,首先可以做知识域的自动分类。第二个作用是自动抽取知识点的实体和关系,本质是基于大模型做预处理,降低对人工的依赖程度。第三个作用是问答对拆分和相似问扩写。过去,该环节非常依赖话术师,有大模型以后可以实现自动化,相关人员则转变为审核职能,即主要负责知识管理,而非知识创建。
具备解决两个校验难题的方案。直接利用大模型进行知识校验存在两个比较明显的问题。首先是过度校验。即原来的回答比较准确,但大模型会演绎出很多新内容,导致校验工作质量下降。第二个问题是新词校验存在滞后性,因为大模型背后的知识是无法实时更新的。厂商可以通过Prompt工程、RAG、微调大模型等方式解决上述两个问题。
具备RAG、微调等缓解大模型幻觉的能力。企业需要利用大模型的生成能力直接生成用户所需的答案。但是,交互方式的变化也为知识库应用带来新的挑战,即大模型幻觉导致的答案不可信。厂商需要具体幻觉大模型幻觉的能力,主要有RAG、微调两种方式。RAG是指在大语言模型推理生成答案时,额外检索调用外部的知识,然后综合其检索结果进行回答生成。RAG为大模型提供了准确、丰富、可解释的知识支撑,从而实现更准确的语义理解、答案推理以及答案解释。微调则是厂商根据行业或企业数据,对基础大模型进行优化,以便其更好地胜任特定任务。对基础大模型进行后训练也是一种缓解大模型幻觉的方式,但较高的成本导致其可行性较低。
入选标准说明:

  1. 符合知识库问答市场分析的厂商能力要求;

  2. 近一年厂商在该市场至少服务1家企业(含POC)。

03 厂商评估:爱数

在这里插入图片描述

厂商介绍:

爱数是一家全域数据能力服务商,通过全域数据的整合、治理、洞察与保护,实现数据的资产化和知识化,与客户共同打造数据驱动型组织。2003年爱数在长沙起步,2006 年上海爱数成立,2023 年爱数集团正式成立,公司双总部位于上海、长沙,目前全球员工约 1700 人,业务遍及 60 多个国家与地区,合作伙伴超过千家,客户积累超过 27000 家,分布于金融、高端制造、运营商、政府、公共事业等各行业。

产品服务介绍:

爱数产品架构分为基础层、认知层和产品层。基础层提供GPU集群和混合数据湖;认知层则通过领域大模型与领域知识网络相互增强,实现认知能力;产品层是指AnyFabric(数据编织架构)、AnyShare(智能内容管理平台)、AnyRobot(可观测性平台)和AnyBackup(统一数据管理平台)等多个应用产品,它们通过认知助手获得大模型赋能。

AnyShare family 7是AnyShare的最新产品,它是爱数打造的属于AGI 时代的智能内容管理平台。AnyShare family 7通过挖掘非结构化数据的标签、编目、实体对象,形成的事件信息和知识,可以服务于合同一致性和风险审核、文案撰写、资料查找。并且,在AnyShare 认知助手加持下,AnyShare family 7实现了大模型辅助创作、辅助内容阅读和智能搜索,同时可以通过内容开放 API 和组件被企业应用集成。

厂商评估:

爱数提供“企业知识+大模型”端到端解决方案,涵盖算力、基础大模型、知识化、应用等多个层面。并且,AnyShare存量客户只需采购爱数大模型一体机和AnyShare认知助手,即可实现轻量化升级。在大模型幻觉方面,爱数以检索增强生成模式(RAG)实现大模型领域化,可以有效缓解幻觉产生。在交付方面,爱数拥有完备的数据管理能力和服务团队,有利于大模型在企业真正发挥价值。同时,AnyShare family 7全模块开放,支持企业搭建个性化应用和流程。

爱数提供“企业知识+大模型”端到端解决方案,涵盖算力、基础大模型、知识化、应用等多个层面。在算力层面,爱数推出大模型一体机(AS19000),不仅让企业能够“开箱即用”,而且该产品将大模型训练与推理分离,实现低成本训练和低资源推理。爱数大模型一体机具有国产芯片和国外芯片两种型号,可以满足不同企业的需求。在基础大模型方面,爱数采用“中立”的架构设计,避免捆绑企业。如果企业没有倾向的大模型,可以直接采购封装了基础大模型的爱数大模型一体机;如果企业有倾向的大模型,可以直接将其接入AnyShare family 7。基础大模型之上是企业数据知识化能力层,爱数可以通过机器学习算法对企业数据进行解构,然后通过重新组装实现语义对齐,最终将其编织到领域知识网络之中。在此方面,爱数具备将企业数据以低成本、自动化方式转化为企业知识的能力。最上面是应用层,爱数提供内容门户、文档中心、工作中心、知识中心、表格中心、SAP数据资产管理等多个应用。
AnyShare存量客户只需采购爱数大模型一体机和AnyShare认知助手,即可实现轻量化升级。企业比较担心大模型应用对企业现状的挑战。一是IT投入挑战,如果需要企业将原有系统推倒,转而使用大模型相关应用,会带来比较高的投入。二是IT负责人规划能力会受到质疑,因为企业原有系统可能刚刚完成建设,未到更新换代的时候,IT负责人推进大模型应用落地可能受到来自企业内部的质疑。三是业务连续性受到挑战,企业将原有系统推倒重建,可能需要较长时间完成系统切换,影响业务开展。爱数AnyShare产品推出时间较久,有众多存量客户。对他们而言,只需采购爱数大模型一体机和AnyShare认知助手,即可实现轻量化升级。大模型一体机包含算力和基础大模型,AnyShare认知助手包含爱数所有基于大模型构建的AI能力。因此,AnyShare存量客户无需推倒原来系统,即可低成本、快速地完成“大模型升级”。
爱数以检索增强生成模式(RAG)实现大模型领域化,有效缓解大模型幻觉。目前,大模型领域化有两种解决思路,分别是检索增强模式(RAG )和Finetune(微调)。检索增强是指在大语言模型推理生成答案时,额外检索调用外部的领域知识网络(领域数据、概念库、知识图谱等),然后综合其检索结果进行回答生成。领域知识网络为大模型提供了准确、丰富、可解释的知识支撑,从而实现更准确的语义理解、答案推理以及答案解释。相比单纯依靠模型训练,外部领域知识网络的引入可以大幅提升回答的准确性和合规性。它有效减少了大模型幻觉,使应用更加可控。爱数以领域知识网络“可控制、可编辑、可保护、可溯源”等特性弥补大模型“不可控、难编辑”等缺陷,有效减少大模型“幻觉”现象的发生。
同时,在构建领域知识网络的过程中,爱数利用大模型的知识提取能力,从已有数据中抽取补充知识,实现知识网络的不断丰富和优化。通过这种良性循环,外部知识网络的引入强化了大模型的知识抽取能力,从而反过来进一步完善知识网络本身。最终使基于该知识网络的大模型应用效果持续提升。
爱数拥有完备的数据管理能力和服务团队,有利于大模型在企业真正发挥价值。基础大模型是实现“企业知识+大模型”的核心,但不是全部,厂商还需要具备权限控制、杀毒、水印等一系列数据管理能力。如果厂商只掌握预训练、微调等方法,容易导致企业在“企业知识+大模型”的应用之路上停留在比较初级的阶段。爱数AnyShare产品已有十余年历史,交付了数千家企业,经过几轮迭代逐渐形成比较完备的数据管理能力,包括权限控制、海量分布式文件管理、容灾、备份、杀毒、水印、国产化、涉密管理等。以权限控制为例,企业内不同角色能接触到的数据、能用大模型来理解的数据必受个人权限限制,爱数能够保证经过语义理解的生成式搜索结果一定是根据使用者所拥有权限能看到的文档所产生的,并能在几十到几百毫秒完成一系列查找、生成工作。
除此之外,爱数拥有比较完备的组织架构为企业提供端到端的服务。爱数打造了专业的、独立于产品研发的服务团队,分区域为当地客户提供开发、部署等服务。爱数的产品研发团队则专注核心产品的研发迭代,保持产品稳定性。相较于组织架构比较单一的厂商,爱数在交付周期、版本控制、服务品质等方面具有一定优势。
AnyShare family 7全模块开放,支持企业搭建个性化应用和流程。AnyShare family 7拥有全新的架构设计,每个模块均保持高度开放性,支持企业搭建个性化应用和流程。企业里一个文档全生命周期包括自动采集录入、对象处理、信息化、杀毒、知识化、纳入知识体系、搜索、门户呈现等环节, AnyShare family 7在每个环节让特定模块来负责,并保持它们的高度开放性。比如企业可以自定义审批、打水印等流程,自定义搜索目标(人、文档或者产品),自定义门户的个性化呈现等。企业可以在每一环节低成本、快速地按照自身需求进行系统接入和开发。
典型客户:

国泰君安、金诚同达

04 入选证书

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/365209.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【Linux】环境基础开发工具的使用之gcc详解(二)

前言:上一篇文章中我们讲解了Linux下的vim和yum的工具的使用,今天我们将在上一次的基础上进一步的讲解开放工具的时候。 💖 博主CSDN主页:卫卫卫的个人主页 💞 👉 专栏分类:Linux的深度刨析 👈 &#x1f4a…

贰[2],Xamarin生成APK

1,生成改为Release版本 2,选中****.Android项目 3,点击生成,选择存档 4,点击分发 5,选择临时 6,添加签名标识 7,选择对应的签名标识,点击另存为

文献阅读:金鱼端脑细胞类型图谱揭示了空间结构和细胞类型进化的多样性

文献介绍 「文献题目」 A telencephalon cell type atlas for goldfish reveals diversity in the evolution of spatial structure and cell types 「研究团队」 Amit Zeisel(以色列理工学院)、Ronen Segev(本古里安大学) 「发表…

认识“协议”

协议 协议的概念结构化数据的传输将结构化的数据组合成一个字符串序列化和反序列化协议定制客户端代码服务线程执行例程 协议的概念 协议,网络协议的简称,网络协议是通信计算机双方必须共同遵从的一组约定,比如怎么建立连接、怎么互相识别等…

H12-811_503

503.如下图所示,下列说法正确是?( ) A.主机A和主机B的广播地址相同 B.主机A可以ping通主机B C.主机A和主机B不能获取对方的MAC地址 D.主机A的ARP缓存中存在如下条目10.0.12.5 MAC-B 答案:C 注释: 两个主机IP地址的网…

Elasticsearch:Geoshape query

Geoshape 查询可以用于过滤使用 geo_shape 或 geo_point 类型索引的文档。 geo_shape 查询使用与 geo_shape 或 geo_point 映射相同的索引来查找具有与查询形状相关的形状的文档,并使用指定的空间关系:相交(intersect)、包含(con…

【代码随想录20】669.修剪二叉搜索树 108.将有序数组转换为二叉搜索树 538.把二叉搜索树转换为累加树

目录 669.修剪二叉搜索树题目描述参考代码 108.将有序数组转换为二叉搜索树题目介绍参考代码 538.把二叉搜索树转换为累加树题目描述参考代码 669.修剪二叉搜索树 题目描述 给你二叉搜索树的根节点 root ,同时给定最小边界low 和最大边界 high。通过修剪二叉搜索树…

Map和Set讲解

🎥 个人主页:Dikz12📕格言:那些在暗处执拗生长的花,终有一日会馥郁传香欢迎大家👍点赞✍评论⭐收藏 目录 集合框架 模型 Set 常见方法和说明 Set总结 Map说明 Map常见方法和说明 Map 中HashMap的 …

SpringMVC入门学习(十)----mvc:annotation-driven标签介绍

目录 1、关于mvc:annotation-driven作用2、mvc:annotation-driven在什么时候必须配置3、关于mvc:annotation-driven配合使用的几种情况 回到顶部 1、关于mvc:annotation-driven作用 [1]、<mvc:annotation-driven /> 会自动向容器中注册如下组件&#xff0c;并且会代替…

2024 美国大学生数学建模竞赛 美赛(D题)五大湖水资源调配问题 国际大学生数学建模竞赛| 建模秘籍文章代码思路大全

铛铛&#xff01;小秘籍来咯&#xff01; 小秘籍希望大家都能轻松建模呀&#xff0c;华数杯也会持续给大家放送思路滴~ 抓紧小秘籍&#xff0c;我们出发吧~ 完整内容可以在文章末尾领取&#xff01; 问题一&#xff1a;建立一个包括五大湖和连接从苏必利尔湖到大西洋的河流的…

2024Node.js零基础教程(小白友好型),nodejs新手到高手,(四)NodeJS入门——http协议

041_网络基础概念_IP的介绍 hello&#xff0c;大家好&#xff0c;我们来一起认识一下IP。 在开始介绍 IP 之前&#xff0c;我们首先来介绍一个场景&#xff0c;方便大家去理解 IP 这个概念。比如这会儿强哥正在成都&#xff0c;然后还有另外一个小伙伴&#xff0c;谁呢&#x…

基于OpenCV灰度图像转GCode的单向扫描实现

基于OpenCV灰度图像转GCode的单向扫描实现 引言单向扫描存在的问题灰度图像单向扫描代码示例结论 基于OpenCV灰度图像转GCode的单向扫描实现 本文将介绍如何使用OpenCV库将灰度图转换为GCode&#xff0c;并通过单向扫描实现对图像的激光雕刻。GCode是一种用于控制数控机床和…

史诗级明星联动 酱香珍品醉龙酿让中国酒文化走向世界

史诗级明星联动 酱香珍品醉龙酿让中国酒文化走向世界 秉承百年酱香工艺&#xff0c;融合全球一流酿造技术&#xff0c;酱香珍品醉龙酿全力推动中国酱香风味走向世界&#xff0c;持续引领全球酱香新变革。卓越口感在征服全球各大商业精英、政府人员、明星达人的同时&#xff0c…

Qt5 基于OpenGL实现六轴机械臂三维仿真

需求 在Qt中通过OPenGL方式加载三维模型STL文件&#xff0c;然后将多个结构的STL文件类型的模型进行组装&#xff0c;形成6轴机械臂三维模型的显示&#xff0c;并且可以对每个关节进行关节角度的控制。 新建一个C类STLFileLoader&#xff0c;用于加载STL文件&#xff0c;并进…

pytorch_car_caring 排坑记录

pytorch_car_caring 排坑记录 任务踩坑回顾简单环境问题代码版本问题症状描述解决方法 cuda问题&#xff08;异步问题&#xff09;症状描述解决方法 任务 因为之前那个MPC代码跑出来的效果不理想&#xff0c;看了一天代码&#xff0c;大概看明白了&#xff0c;但要做改进还要有…

张维迎《博弈与社会》多重均衡与制度和文化(3)法律和社会规范的协调作用

社会博弈通常存在多个纳什均衡。许多情况下&#xff0c;多个纳什均衡之间并不存在优劣之分&#xff1b;即使有优劣之分&#xff0c;也很难通过无成本的交流而选择一个特定的纳什均衡。这就产生了对制度和文化的需求。社会制度和社会规范&#xff08;文化、习惯等&#xff09;的…

RIP——路由信息协议

目录 1 内部网关协议 RIP 1.1 协议 RIP 的工作原理 1.2 RIP“距离”的定义 1.3 RIP 协议的三个特点 1.4 RIP 协议的优缺点 1.5 路由表的建立 路由表主要信息和更新规则 2 距离向量算法 3 RIP2 报文 4 坏消息传播得慢 5 启动RIP 启动RIP: router rip 命令 启用和检…

nrm切换镜像源-yarn不生效问题

在说这问题前&#xff0c;大家肯定知道nvn管理node版本&#xff0c;不懂的朋友直接看此文&#xff1a; nvm - nodejs版本管理工具&#xff1a;https://blog.csdn.net/tianlu930/article/details/135988727 要安装node自带npm其实不好用&#xff0c;一般都用再装yarn&#xff0c…

【Java程序设计】【C00196】基于(JavaWeb+SSM)的旅游管理系统(论文+PPT)

基于&#xff08;JavaWebSSM&#xff09;的旅游管理系统&#xff08;论文PPT&#xff09; 项目简介项目获取开发环境项目技术运行截图 项目简介 这是一个基于ssm的旅游平台 本系统分为前台、管理员2个功能模块。 前台&#xff1a;当游客打开系统的网址后&#xff0c;首先看到的…

【VSCode 光标返回上一位置】

默认按键 Windows: Alt ← ;或者 鼠标侧键 Linux: Ctrl Alt - ;貌似数字键盘的减号没效果 Mac: Ctrl - 自定义修改方法&#xff1a; VSCode左下角 “管理 / Manage” “键盘快捷方式 / KeyBoard Shortcuts” 搜索 “前进 / Go Forward 或 后退 / Go Back” 双击需…
最新文章