通往AGI路上,DPU将如何构建生成式AI时代的坚实算力基石?

4月19日,在以“重构世界 奔赴未来”为主题的2024中国生成式AI大会上,中科驭数作为DPU新型算力基础设施代表,受邀出席了中国智算中心创新论坛,发表了题为《以网络为中心的AI算力底座构建之路》主题演讲,勾勒出在通往AGI之路上,DPU技术赋能下一代AI算力基础设施中的关键作用。

015d7cc3db50680e6489655de1e137da.jpeg

▲中科驭数产品运营部副总经理曹辉受邀发表主题演讲

算力是当前人工智能领域发展的关键,是AI时代的“面包”。要训练百万亿参数超大预训练模型,算力基础设施架构优化是提升算力的首要步骤。当前,DPU算力基础已经发展迭代了4到5年,算力领域对DPU的期望和需求已经涵盖计算、网络、存储、安全等多个领域。

中科驭数旨在通过DPU将计算加速、存储加速、网络加速、安全加速及云原生加速等基础设施层深度整合,构建高性能、高集成的AI服务基础架构。公司已基于此打造出涵盖云原生DPU软硬一体加速、RDMA/RoCE AI计算网络、NVMe-oF高性能存储、灵活存算分离架构、DPU硬件级安全隔离以及数据中心资源池化与统一调度的丰富产品矩阵与解决方案,不仅仅能够助力AI算力底座的整体性能提升,也为用户提供了更高效更完整的基础设施解决方案,有力支撑各类AI应用的快速发展。

以中科驭数自研FLEXFLOW®-2100R RDMA加速DPU卡为例,该加速卡产品能够将高性能、稳定性、便捷性和通用性融为一体,提供2x100GbE网口的连接能力,支持RoCEv2的硬件卸载能力以及无损网络能力,为国产化业务场景提供微秒级时延和百G带宽的RDMA网络环境,为用户提供灵活和高性能的网络解决方案。同时,适配市面上所有主流支持无损网络的交换机,以及国内外主流服务器和操作系统,可以快速接入现有RDMA网络环境。经实测,KPU FLEXFLOW®-2100R在4K以下小文件send、read、write测试场景中,时延数据均在5us以下,最低可达3us,优于国内外主流RDMA智能网卡性能水准。

e15a127ea48cad60768c94c9a162bd03.jpeg

▲ FLEXFLOW®-2100R RDMA加速DPU卡

需要看到的是,随着AI向更多领域渗透,对基础设施的需求将更加多元化、智能化。同样,DPU的成功落地和使用需要经过精心设计和打磨,以满足整个基础设施领域的多样需求。中科驭数将继续秉持着技术创新和开放合作的理念,欢迎服务器厂商、CPU/GPU厂商、操作系统厂商等上下游合作伙伴加入驭数DPU生态,共同推动AI算力底座的发展。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/579906.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Python_AI库 Pandas的数据结构及基本操作

Python_AI库 Pandas的数据结构及基本操作 本文默认读者具备以下技能: 熟悉python基础知识,vscode或其它编辑工具 熟悉表格文件的基本操作 具备自主扩展学习能力 本文篇幅较长,但比较重要,希望读者可以认真看完并实例运行。 Pa…

不可重复读,幻读和脏读

不可重复读一般在读未提交,读已提交这两种隔离级别出现,第一次读和第二次读的数据不一致。 幻读一般在读未提交,读已提交,可重复读出现,原因是第一个事务执行时,第二个事务完成了提交,在第一个…

Xilinx 7系列MMCM/PLL的使用模型

本文展示了MMCM的一些使用模型(同样适用于PLL),如时钟网络去偏斜、具有内部反馈的MMCM和零延迟缓冲区等。 1、时钟网络去偏斜(Clock Network Deskew) MMCM的主要用途之一是用于时钟网络去偏斜。图3-11和图3-12展示了…

SpringCloud中网关-详解、案例(代码)

简介:在Spring Cloud中,网关的角色是非常重要的,它负责整个系统的入口流量,并且可以处理路由、过滤、协议转换等操作 目录 1、网关的技术实现 1.1 网关功能 1.2 网关的形式 2、网关实现步骤 2.1 添加相关依赖 2.2 创建此mod…

获取1年免费的SSL证书

之所以写这篇帖子是因为一直使用的阿里云和腾讯云免费的ssl证书由一年有效期相继改为了3个月,3个月换一次证书想太过麻烦了,还是需要一年有效期的证书更为适合 有两个站点推荐:(本次以FreeSSL为例) .JoySSL一个提供免费HTTPS证书申请的网站 FreeSSL.c…

156.25MHz的差分晶体振荡器SG3225VEN

数字经济正焕发出勃勃生机,云计算,大数据,5G和人工智能等新技术的发展给行业带来了新的机遇。无论是在数据中心内部还是在数据中心之间,提供低成本,高速的100/200/400G小型化解决方案都是光模块的发展需求。为了使DSP稳定工作,需要一个小型的封装晶体振荡器来提供参…

嵌入式学习63-C++

知识零碎: newmalloc friend 友元函数 …

面向对象练习题【从零开始学Java】

Java零基础系列课程-JavaSE基础篇 Lecture:波哥 Java 是第一大编程语言和开发平台。它有助于企业降低成本、缩短开发周期、推动创新以及改善应用服务。如今全球有数百万开发人员运行着超过 51 亿个 Java 虚拟机,Java 仍是企业和开发人员的首选开发平台。…

nginx修改http为https

Linux运维工具-ywtool 目录 一. 获取 SSL 证书1.安装openssl2.自签名证书 二.安装SSL证书三.配置Nginx支持HTTPS四.重启nginx 一. 获取 SSL 证书 SSL/TLS证书是用来验证服务器身份和提供一个安全的连接通道的 获取SSL/TLS证书有几种方法 1.购买域名,购买SSL证书 2.自签名证书…

[linux网络编程]UDP协议和TCP协议的使用

目录 看以下内容前,你要先了解main函数带参数有什么用、 了解socket的相关函数接口 如果不了解socket的相关函数接口请先看我这篇文章 main函数带参数有什么用 UDP udp_server 1.生成socket文件描述符 2.填充sockaddr_in信息 3.bind 4.发(收&…

序列化与反序列化

【一】序列化跟反序列化 # api接口开发,最核心最常见的一个过程就是序列化,所谓序列化就是把数据转换格式,序列化可以分两个阶段:【序列化值的是转换数据格式:序列化,返序列化】# 序列化: 把我们…

使用frp实现内网穿透教程

文章目录 简介frp 是什么?为什么选择 frp? 概念工作原理代理类型 内网穿透教程服务端安装和配置本地Windows(客户端)安装和配置本地Linux虚拟机(客户端)安装和配置使用 systemd 管理服务端注意事项 简介 f…

openapi3和openapi2的注解区别

最近在该项目,发现openapi3版本相比起2版本已经发生了很大的变化,原来的注解全部失效了,取而代之的是新的注解

基于Transformer深度学习的翻译模型(英->中)源码系统

第一步:Transformer介绍 Transformer是一种基于注意力机制的序列到序列模型,它在机器翻译任务中表现出色并逐渐成为自然语言处理领域的主流模型。Transformer模型的核心思想是使用自注意力机制(self-attention)来捕捉输入序列中各…

【Java系列】给大家出一些JavaSE基础第七天的内容案例 , 让大家更好的理解与掌握

面向对象 好的,以下是一些Java面向对象基础的案例: 案例一 1. 定义一个学生类Student,包含姓名、年龄、性别等属性,以及学习、吃饭等行为。然后创建一个学生对象,调用其行为方法。 public class Student {private St…

Linux驱动开发:深入理解I2C时序

目录标题 I2C简介I2C时序关键点Linux内核中的I2C时序处理I2C适配器I2C算法I2C核心 代码示例:I2C设备访问调试I2C时序问题 在Linux驱动开发中,理解和正确处理I2C时序对于确保I2C设备正常工作至关重要。本文将详细介绍I2C通信协议的时序特征,并…

西门子程序专业备份软件BUDdy for S7和使用说明

西门子程序专业备份软件BUDdy for S7和使用说明

基于Springboot的web后端开发三层架构上手实操

引言 我们拿到了xml文件 我们要将将xml文件中的数据加载并解析 完成数据的处理 并且返回给前端页面(result格式) 1.将xml文件放在resources目录下 xml是我们需要解析的文件 查看xml文件 2.在springboot中引入dom4j依赖 解析xml需要在springboot中引入dom4j依赖 这边我们…

Docker——部署LNMP架构

目录 一、LNMP架构概述 1.项目环境 2.服务器环境 3.需求 二、搭建Linux系统基础镜像 三、部署Nginx 1.建立工作目录 2.编写Dockerfile脚本 3.准备Nginx.conf配置文件 4.生成镜像 5.创建自定义网络 6.启动镜像容器 7.验证Nginx 三、部署Mysql 1.建立工作目录 2.编…

【STM32+HAL】读取电池电量

一、准备工作 有关CUBEMX的初始化配置,参见我的另一篇blog:【STM32HAL】CUBEMX初始化配置 有关定时器触发ADC模式配置,详见【STM32HAL】ADC采集波形实现 有关软件触发ADC模式配置,详见【STM32HAL】三轴按键PS2摇杆 二、所用工具…
最新文章