突破AI迷雾:英特尔携手星环科技打造向量数据库革新方案,直降大模型幻觉

去年爆火的大模型,正在从百模大战走向千行百业落地应用。不过行业数据规模有限,企业数据隐私安全的要求等等因素,都让行业大模型的准确率面临挑战。近期发布的《CSDN AI 开发者生态报告》数据显示,“缺乏数据/数据质量问题”在大模型技术开发者面临的问题中,占据首位。


具体来说,行业领域大模型需要有对行业(如医学、法律、科研)高深专业术语的理解、完成特定的行业领域任务,并且对大模型输出结果要求准确,无法如个人用户一样接受大模型的反复多次推理。

RAG 技术有效降低模型幻觉,加速行业大模型落地

检索增强生成技术 RAG(Retrieval-Augmented Generation)应时而生。在 RAG 系统中,使用向量数据库进行信息检索是系统能够正常运行的核心功能之一,通过 embedding 技术将问题和知识库内容转换为向量,基于相似性找到最相关的文档并提供给大模型生成答案。

采用 RAG 技术可以有效地解决大模型在知识更新不及时、数据安全、存在幻觉等方面的问题,通过向量数据库、图数据库等作为大模型的外置知识库,使大模型具有更高的精确度,因此,在今年受到技术界的广泛关注。RAG 与向量数据库成为了行业模型落地的优选项。

在云计算时代拥有自研大数据技术的资深数据厂商星环科技,正在进一步基于 RAG 技术与星环科技向量数据库 Transwarp Hippo,利用行业与企业中存在的大量半结构化和非结构化数据,去提升行业大模型的准确性。

Transwarp Hippo 是一款企业级云原生分布式向量数据库,支持存储、索引以及管理海量的向量式数据集,解决向量相似度检索以及高密度向量聚类等问题。Hippo 具备高可用、高性能、易拓展等特点,支持多种向量搜索索引,以及数据分区分片、数据持久化、增量数据摄取、向量标量字段过滤混合查询等功能,能够很好的满足企业针对海量向量数据的高实时性检索等场景需求。

CPU 助力大模型优化创新,星环科技与英特尔发布向量数据库解决方案

不过,大模型与数据系统的性能提升绝非易事,企业落地大模型,除了要确保模型的实时性、隐私安全和准确性之外,还有考虑系统性能、扩展性,以及部署实施成本等因素。为了系统软硬件结合调优,提升向量数据库性能,并降低企业落地大模型的成本,星环科技与英特尔联合发布了向量数据库解决方案。

结合英特尔至强可扩展处理器多方面的性能优势,并把软硬件进行深度融合,英特尔携手星环科技打造了一个整体更加高性能的解决方案,值得注意的是,这也是一个用 CPU 去实现大模型优化的创新方案。英特尔中国软件技术合作事业部总经理唐炯表示:“和星环科技的合作,能帮助英特尔从更完整的、端到端的客户需求角度来理解数据存储、数据治理、智能分析等技术需求,为中国市场交付更能够满足用户综合需求和使用习惯的硬件产品。”

具体来说,该解决方案得益于英特尔至强可扩展处理器里集成的 AVX512 扩展指令集,重写向量距离计算函数,降低向量计算所需 CPU 指令与 CPU Cycle 数量,能够充分发挥处理器高内存带宽优势。另外,方案采用 NUMA 友好的向量计算负载调度算法,避免 CPU 远程内存访问造成 CPU Stalling,充分发挥了英特尔至强可扩展处理器的多核性能优势。第三,基于数据离散度的浮点数矢量化算法,以及充分利用 VNNI 指令集,该方案进一步提升了向量计算的性能。

方案中使用的 AVX-512 是英特尔至强可扩展处理器中的一项集成内置加速器功能——英特尔® 高级矢量扩展 512(英特尔® AVX-512)。AVX-512提供针对 AI、分析、科学模拟、金融模拟和其他涉及基于矢量计算的计算密集型任务的内置加速,而无需其他独立加速器,从而在降低复杂性的同时也控制了成本。得益于Hippo向量数据库和至强可扩展处理器的性能优势,软硬件一体的联合解决方案整体性能可以实现20%-30%左右的提升



联合方案用向量数据库可以解决大模型领域知识实时性低、数据隐私安全、模型幻觉等问题,通过软硬件的深度优化,能够满足海量、高纬度向量数据处理对性能的极致需求,并具备低时延和高精确度等优势。对于企业而言,该方案可以让 AI 数据系统按需进行水平扩展,以容器化技术支持服务弹性扩/缩容,满足企业未来发展对海量、高维度向量数据存储和计算的需求,降低大模型二次训练的成本,并且通过系统自带 Embedding 工具和模型、高扩展、高性能等特性提升企业在大模型建设方面的总体拥有成本效益。

星环科技基础架构部副总经理刘熙指出,“与英特尔联合研发,共同优化星环科技的数据库产品,让向量数据库在通用 x86 服务器上就可以获取 AI 应用所需要的性能和特性。”此外,数智融合趋势下,AI 对数据的需求还有很多。刘熙也分享了对大数据技术的趋势观察和星环科技的实践成果,分别是湖仓集一体化、实时数据和历史数据融合分析、利用大数据技术增强大模型能力、利用大模型来增强大数据分析

而本次联合发布方案已经不是星环科技与英特尔第一次合作。刘熙表示早前双方已经联合研发推出了分析型数据库软硬件一体的解决方案。现在英特尔与星环的深层合作已经遍及 AI 大模型各层,希望全方位助力企业落地大模型并实现降本增效。

回到《CSDN AI 开发者生态报告》,我们能够看到,除了数据问题,让大模型技术落地的开发工作无比庞杂,开发者面临的问题还有如 AI 大模型技术基础设施不足、缺乏和难招聘 AI 技术人才,以及监管、法律风险与合规性等问题。灵活、性价比永远是企业落地新兴技术的关注重点,而基于 CPU 构建的 AI 数据方案,可以让企业更灵活的通过软硬件技术,落地大模型与 AI 应用,对大多数企业而言是更具可行性的技术路线。我们将持续关注大模型创新技术与应用落地实践。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/600662.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

ILI9341显示驱动芯片的使用

ILI9341是一种常见的TFT LCD显示驱动芯片,它在众多的应用中都有广泛的使用。这种芯片的一个显著特点是它支持16位RGB565颜色,这意味着它可以显示多达65536种不同的颜色。这使得ILI9341能够提供鲜艳、生动的色彩效果,对于需要表现丰富色彩的应…

解决Python中的 `ModuleNotFoundError: No module named ‘fcmeans‘` 错误

ModuleNotFoundError: No module named fcmeans 解决Python中的 ModuleNotFoundError: No module named fcmeans 错误如何解决这个错误fcmeans 库简介应用实例 解决Python中的 ModuleNotFoundError: No module named fcmeans 错误 在进行数据科学或机器学习项目时,…

【QA】Java常见运算符

前言 本文主要讲述Java常见的运算符 运算符的概念 两个基本概念: 运算符:对字面量或者变量进行操作的符号 表达式:用运算符把字面量或者变量连接起来符合java语法的式子就可以称为表达式 示例: int a 10; int b 20; int …

上证50etf期权到底该怎么玩?

今天期权懂带你了解上证50etf期权到底该怎么玩?ETF期权是一种股票市场上的金融衍生品,它是在交易所上市交易的期权合约,其标的资产是某个特定的交易所交易基金(ETF),如上证50指数ETF或沪深300指数ETF等。 上…

2023黑马头条.微服务项目.跟学笔记(五)

2023黑马头条.微服务项目.跟学笔记 五 延迟任务精准发布文章 1.文章定时发布2.延迟任务概述 2.1 什么是延迟任务2.2 技术对比 2.2.1 DelayQueue2.2.2 RabbitMQ实现延迟任务2.2.3 redis实现3.redis实现延迟任务4.延迟任务服务实现 4.1 搭建heima-leadnews-schedule模块4.2 数据库…

品深茶的抗癌功能是否涉及虚假宣传?

品深茶说到底,本质还是中国传统茶叶,茶叶本就是一种含有多种成分的饮品,包括茶多酚、生物碱、氨基酸、有机酸等。这些成分对人体有一定的益处,如抗氧化、抗炎、抗菌等作用。 一些研究表明,茶叶中的某些成分如茶多酚、…

以中国为目标的DinodasRAT Linux后门攻击场景复现

概述 在上一篇《以中国为目标的DinodasRAT Linux后门剖析及通信解密尝试》文章中,笔者对DinodasRAT Linux后门的功能及通信数据包进行了简单剖析,实现了对DinodasRAT Linux后门心跳数据包的解密尝试。 虽然目前可对DinodasRAT Linux后门的通信数据包进…

关于在Conda创建的虚拟环境中安装好OpenCV包后,在Pycharm中依然无法使用且import cv2时报错的问题

如果你也掉进这个坑里了,请记住opencv-python!opencv-python!!opencv-python!!! 不要贪图省事直接在Anaconda界面中自动勾选安装libopencv/opencv/py-opencv包,或者在Pycharm中的解…

FPGA学习笔记(3)——正点原子ZYNQ7000简介

1 ZYNQ-7000简介 ZYNQ 是由两个主要部分组成的:一个由双核 ARM Cortex-A9 为核心构成的处理系统(PS,Processing System),和一个等价于一片 FPGA 的可编程逻辑(PL,Programmable Logic&#xff0…

github提交不了的问题

开了VPN提交的时候提示这个报错 是需要这两个端口号一致,就能提交了

智慧应急三维电子沙盘系统

深圳易图讯科技有限公司(www.3dgis.top)自主研发的智慧应急三维电子沙盘系统依托大数据融合物联网、云计算、移动互联、5G、BIM、三维GIS等新一代信息技术,集成了高清卫星影像、地形数据、实景三维模型、现场环境数据、物联感知信息、人口、建…

KAN: Kolmogorov–Arnold Networks

KAN: Kolmogorov–Arnold Networks 论文链接:https://arxiv.org/abs/2404.19756 代码链接:https://github.com/KindXiaoming/pyKAN 项目链接:https://kindxiaoming.github.io/pyKAN/intro.html Abstract 受Kolmogorov-Arnold表示定理的启…

常用算法汇总

作者:指针不指南吗 专栏:算法篇 🐾算法思维逻辑🐾 文章目录 1.判断闰年2.计算从某天到某天的天数3.二分4. 前缀和5.差分6.图论6.1dfs6.2走迷宫 7.最短路7.1dijkstra7.2foly 8.并查集9.数论9.1gcd lcm9.2判断素数(质数)9.3分解质因…

python学习笔记-02

变量和数据类型 程序中运用变量存储数据,python是一门强类型语言,赋值时不需要指定数据类型。 1.变量的定义 语法格式:变量名数据 a10 print(a) a哈哈 print(a)python中基本数据类型: 数字(num):int(有符号整数)、lo…

网站安全大揭秘:十大常见攻击方式与应对策略

随着互联网的普及,恶意内容攻击事件屡见不鲜。当一个网站遭遇恶意内容攻击时,不仅会影响用户体验,还可能对用户数据和隐私造成严重威胁,那么,网站都存在哪些形式的恶意攻击呢? 每种攻击的应对策略又是什么&…

如何练英语口语?三个简单练习方法

如何练英语口语?在全球化日益加速的今天,英语已经成为了一种必不可少的交流工具。对于很多人来说,尤其是那些想要在国际舞台上崭露头角的人,流利的英语口语更是必不可少的技能。但是,很多人也面临着一个问题&#xff1…

搭建Springboot的基础开发框架-01

本系列专题虽然是按教学的深度来定稿的,但在项目结构和代码组织方面是按公司系统的要求来书定的。在本章中主要介绍下基础开发框架的功能。后续所有章节的项目全是在本基础框架的基础上演进的。 工程结构介绍 SpringbootSeries:父工程,定义一…

男士内裤品牌哪个好?口碑最好的男士内裤汇总

许多男士选内裤可能比较随意,但实际上作为长时间贴合身体皮肤的贴身衣物,经常会出很多汗。而普通的内裤会吸附很多汗水却不易干,导致细菌含量超标,摩擦力增强,容易造成破皮感染从而影响健康。 但是现在的男士内裤种类和…

Sentinel-Dashboard安装

1. Docker官方镜像 找到跟你版本相对于的镜像进行拉取: https://hub.docker.com/r/bladex/sentinel-dashboard # 运行容器 Sentinel默认端口 8858 docker run --name sentinel-dashboard -p 8858:8858 -d bladex/sentinel-dashboard:1.8.6 &#xfeff…

【智能优化算法】野狗智能优化算法(Dingo Optimization Algorithm DOA)

野狗智能优化算法(Dingo Optimization Algorithm DOA)是期刊“MATHEMATICAL PROBLEMS IN ENGINEERING”的2021年智能优化算法 01.引言 野狗智能优化算法(Dingo Optimization Algorithm DOA)该算法的灵感来自野狗的狩猎策略,即迫害攻击,分组策略和清除行…
最新文章