揭秘阿里新大招:大模型只是前菜

技术的代际变革往往对商业格局产生深远影响。眼下,随着产业各界对大模型的投入布局加深,一个业界共识逐渐诞生:大模型正在改变云生态,将为云计算行业带来新的奇点。

在过去的一段时间里,市场研究机构IDC在2022年底的预测报告中,将中国云计算行业在未来五年的平均增长速度下调了10%。这一调整是受到互联网行业整体增速放缓的影响,同时政企集成业务也在调整过程中。这些因素共同导致了互联网云厂商普遍降低了业务预期。

在此背景下,AI大模型就是这次的技术奇点,阿里云是这轮变革的主要推动者。4月11日,阿里云峰会上,阿里巴巴集团董事会主席兼CEO张勇首次以阿里云智能CEO的身份亮相,旗下大模型产品“通义千问”随即面世。

活动现场,张勇表示,阿里巴巴所有产品未来将接入“通义千问”大模型,钉钉、天猫精灵已率先接入通义千问测试,并会在评估认证后正式发布新功能;阿里云智能集团CTO周靖人称,通义千问将基于阿里云基础设施向企业开放,企业可以在阿里云上训练企业自己的行业、垂类大模型。

从已知信息可以推断出,阿里巴巴对于“通义千问”项目的战略部署,并未仅仅将目光停留在类GPT模型的领域,而是着眼于未来更为广阔和深远的应用场景,展示出雄心勃勃的远景规划。

将把通义千问“装进”阿里所有产品

在此次峰会上,张勇郑重宣布,未来阿里巴巴旗下的所有产品将与“通义千问”大模型进行整合,实现全面的革新与升级。

“AI大模型的出现是一个划时代的里程碑,人类将进入到一个全新的智能化时代。就像工业革命一样,大模型将会被各行各业广泛应用,带来生产力的巨大提升,并深刻改变我们的生活方式。”张勇表示。

拿钉钉、天猫精灵来说,钉钉在接入“通义千问”后增加了近10项新AI功能,通过类似微软Copilot(副驾驶)的设定,用户可以随地唤醒AI来辅助日常的工作。

具体而言,根据钉钉当天预告的Demo演示,接入“通义千问”之后:

在群聊场景中,钉钉在你被加入新的群聊时,能够依据群内过往的对话记录,智能生成一份聊天概要。这一功能旨在帮助用户迅速掌握讨论主题和上下文,免去繁琐的手动回顾过程,提高沟通效率。

在钉钉文档场景中,“通义千问”展现出了全方位的办公辅助能力,无论是创作诗歌、小说、撰写电子邮件,还是制定营销策划方案等多种任务,均可得心应手。此外,除了生成各类文案内容,它还具备根据指令智能生成创意图片的能力,为工作带来更多便捷与灵感。

在钉钉会议应用中,“通义千问”具备实时生成会议记录的能力,并能自动梳理出会议纪要和待办事项,提升会议效率。此外,钉钉视频会议还支持实时字幕功能,让参会者不仅能看到发言内容,还能清楚了解谁在发言。同时,新加入的会议成员可以通过智能摘要迅速掌握之前的讨论内容。在会议结束后,钉钉还可为参会者生成重点摘要和待办事项,帮助参会者高效安排后续工作。

令人眼前一亮的是,钉钉展示了一种基于拍照生成小程序的场景。用户只需上传一张功能设计草图,就能实现低代码业务应用的快速生成,无需编写代码便可创建出一款实用的应用。如此创新使得应用开发的门槛得到了进一步降低,为广大用户带来更多便捷。

钉钉之外,“通义千问”在天猫精灵上的表现同样不俗。

依据天猫精灵官方展示的演示Demo,接入“通义千问”后,新一代的天猫精灵将具备更为灵活的对话能力。它能够根据用户的实际需求以及所处场景,实时生成相应的内容,为用户带来更为智能化和个性化的互动体验。

例如,用户在跑步过程中,可以要求天猫精灵“根据180步频合成适合跑步的歌单”,同时还能与天猫精灵展开关于文化、人生等领域的深入交流。得益于“通义千问”强大的技术支持,天猫精灵的用户体验将更具智能化、便捷性和多样化特点,为用户带来更高品质的服务。

淘宝天猫的电商业务,也有大量场景适合大模型切入。例如,以文搜图、智能客服、卖点文案生成等。这将使购物体验变化巨大,用户可以在需求模糊的情况下,通过更智能的交互直接找到合适的商品推荐。

可以设想,在未来阿里巴巴所有产品成功接入“通义千问”大语言模型并实现全面升级后,各种各样的生活场景都有可能面临AI带来的应用方式的彻底改变和革新。这将为日常生活带来前所未有的便捷性和智能化体验。


大模型生态“活水”

以上,阿里巴巴的“通义千问”主要是与集团内部产品相结合,以提升产品性能和用户体验。然而,除了内部产品协同发展之外,阿里巴巴的大语言模型同样具有一条面向外部生态的路线。

现阶段,老牌互联网巨头和人工智能新秀们纷纷押注大模型技术,期望从中获得更大的商业价值和科技突破。这种盛状使得大模型技术成为了科技领域的一股新风潮。

目前,大模型技术已经取得了令人瞩目的成果,大型预训练模型在自然语言处理、文本生成、知识问答等方面表现出了惊人的能力。这些大模型在很多领域已经开始实现商业化应用,比如智能客服、内容推荐、智能写作等。

然而,随着大模型技术的盛行,也引发了一些担忧。譬如,大模型需要大量的计算资源和数据,这使得研发门槛日益提高,可能导致只有少数科技巨头才能参与竞争。在某种程度上,这已经形成了国内人工智能发展的重要瓶颈。

对此,此次云峰会,张勇表示,面向 AI 时代,所有产品都值得用大模型重做一次,为此,阿里云也希望帮助更多企业用上大模型,让每家企业都能基于“通义千问”,拥有具备自己行业能力的专属大模型。

换句话说,在阿里巴巴提供的强大算力基础设施、先进的机器学习平台以及大模型服务的支持下,企业们不再需要浪费时间和精力去“reinventing the wheel”或是陷入针对大模型通用能力的无谓竞争。

相反,他们可以将更多关注集中在开发具有原创性和专属特点的模型上,以推动行业的持续创新。

周靖人进一步解释称,在未来的阿里云平台上,各个企业不仅能够充分利用通义千问的全面能力,还能根据自身所在行业的特点和具体应用场景,培训和定制自家的企业级大模型。举例来说,每家企业都有可能拥有自己专属的智能客服、智能导购、语音助手、文案撰写助手、AI设计师以及自动驾驶等相关模型。

作为印证,发布会现场阿里云宣布将与OPPO安第斯智能云携手共建OPPO大模型基础设施,借助通义千问实现大模型的持续学习、精细调整以及前端提示工程。此外,诸如中兴通讯、吉利汽车、智己汽车、奇瑞新能源、毫末智行、太古可口可乐、波司登和掌阅科技等多家知名企业亦表示,他们将与阿里云在大模型相关领域展开技术合作的探讨与共同创新。

为推广基于模型开发人工智能的新开发方式,除了开放大模型外,阿里云也在积极建设开源的AI社区生态。

在2022年11月,阿里云率先提出了“Model as a Service”的创新理念,并随后推出了国内首个AI模型社区“魔搭”。在这个平台上,开发者们可以轻松下载各种开源AI模型,同时直接利用阿里云的强大计算能力和一站式的AI大模型训练及推理服务。

仅仅几个月里,已经有超过百万用户共下载了1600万次各类模型。与此同时,平台上可用的模型数量也从最初的三百多个迅速扩展至八百多个。在这些模型中,参数数量超过十亿的大模型有三十多个,而超过百亿参数的大模型更是达到了10个。

从这里来看,关于大模型生态的篇章才刚刚揭开序幕。


阿里大模型的底气:AI基础设施内功

从长远的角度来看,要实现“通义千问”在各行各业的广泛应用,离不开智能化技术的支持,以及在算力、算法和大数据等方面的技术优化。这些技术优势正是阿里巴巴多年来不懈努力和技术积淀的成果。

拿大模型技术来说。公开资料显示,阿里云从2019年就开始同时研究多模态大模型和语言大模型。2021年,阿里巴巴达摩院相继推出了语言大模型Plug以及多模态大模型M6。随后在2022年9月,阿里大模型融合为“阿里通义大模型系列”。

不仅如此,大模型的训练和运行背后同样需要强大的算力基础。这些算力要求包括以下几个方面:

高性能计算硬件,大模型需要大量的计算资源,例如高性能的图形处理器(GPU)、专用的AI芯片;分布式计算,由于大模型的参数数量和计算复杂度非常高,单个计算设备很难满足其需求;高效的算法和优化技术,为了降低大模型的训练时间和计算成本,研究人员需要开发高效的算法和优化技术。

总之,大模型背后需要强大的算力基础,包括高性能计算硬件、分布式计算框架、高效的算法和优化技术以及大量的训练数据和存储资源。这些因素共同支撑着大模型的成功运行。

对此,阿里云做了充足准备。在峰会上,张勇表示,十多年来,阿里云已经累积了从飞天云操作系统、芯片到智算平台的“AI+云计算”的全栈技术实力,并在IaaS(基础设施即服务)和PaaS(平台即服务)的基础上,建立了第三层MaaS(模型即服务)的体系。

具体而言,“飞天智算基础设施”智算IaaS服务涵盖了一系列卓越特性,包括能够支持高达十万卡GPU的单集群规模、可让多个万亿参数大模型同时在线训练的强大智算集群,以及为万卡规模AI集群提供无拥塞通讯的自主研发RDMA网络架构等;

智算PaaS服务则以机器学习平台PAI为核心,可支持万卡的单任务分布式训练规模,AI训练效率提升可达10倍,推理效率提升可达6倍,覆盖全链路AI开发工具与大数据服务,深度支持了通义大模型的研发;

智算MaaS服务包括通义大模型系列和以之为基础的企业定制大模型。

以上这些表明,阿里云不仅致力于为自家大模型“通义千问”打造坚实的技术基础,而且还将把丰富的算力资源和大模型能力分享给更多企业和社会各界,共同推动AI技术的发展。

可以看到,凭借长期积累的技术实力与研发投入,阿里巴巴在大语言模型相关技术的竞争中表现出色,在中国乃至全球范围内,均展现出了卓越的综合实力与竞争优势。

也正是在此技术基础上,除了大模型这盘前菜之外,无论是阿里巴巴全面实施大模型改造其旗下所有产品的智能化进程,亦或是面向外部生态的大模型路线,这两盘“猛菜”共同构成了阿里巴巴别出心裁的战略布局。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/12563.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

瑞吉外卖项目——读写分离

读写分离 读和写所有压力都由一台数据库承担,压力大数据库服务器磁盘损坏则数据丢失,单点故障 Mysql主从复制 介绍 MySQL主从复制是一个异步的复制过程,底层是基于Nysql数据库自带的二进制日志功能。 就是一台或多台MysQL数据库&#xf…

偶数科技发布实时湖仓数据平台 Skylab 5.0

2023 年 4 月 11 日, 偶数发布了最新的实时湖仓数据平台 Skylab 5.0,平台各个组件进行了全面升级。新版 Skylab 的发布标志着偶数科技具有从数据存储、计算、管理到分析、应用和 AI 能力的完整的数据管理生态闭环,帮助用户实现批流一体、实时…

LeetCode LCP 04. 覆盖【二分图最大匹配,匈牙利算法】困难

本文属于「征服LeetCode」系列文章之一,这一系列正式开始于2021/08/12。由于LeetCode上部分题目有锁,本系列将至少持续到刷完所有无锁题之日为止;由于LeetCode还在不断地创建新题,本系列的终止日期可能是永远。在这一系列刷题文章…

[Java]Session机制

什么是Session Session是另一种记录客户状态的机制,不同的是Cookie保存在客户端浏览器中,而Session保存在服务器上。客户端浏览器访问服务器的时候,服务器把客户端信息以某种形式记录在服务器上。这就是Session。客户端浏览器再次访问时只需…

springboot整合redis

一、总体概述 1、redis配置文件 redis.conf配置文件,改完后确保生效,记得重启,记得重启 默认daemonize no 改为 daemonize yes 默认protected-mode yes 改为 protected-mode no 默认bind 127.0.0.1 改为 直接注释掉(默认bind 127.0.0.1只能…

ApplicationContextAware接口

一、ApplicationContextAware接口的基本介绍 public interface ApplicationContextAware extends Aware {void setApplicationContext(ApplicationContext applicationContext) throws BeansException;}在Spring/SpringMVC中,我们拿到IOC容器无非有三种方式&#x…

HCIE-Cloud Computing LAB常见问题收集谱

第一题:FusionCompute 扩容CNA与对接共享存储 FusionCompute:关联存储资源失败 物理阵列里面太多没清理的了。然后去排查问题,存储地址也正确,管理接口也互联,IQN号也修改了,结果是启动器快满了 排查网…

Javaweb基础配置模板(mybatis+javaweb)

1.大纲规划图 本配置涉及的技术:mybatis,javaweb,json转换&#xff0c;分页查询等 2.导入相关的配置文件pom.xml 2.1 依赖文件 <dependencies> <!-- 测试依赖--><dependency><groupId>junit</groupId><artifactId>junit</artifact…

如何把视频里的声音提取出来,4种有效方法学起来

在我们日常生活中&#xff0c;可能会有需要从视频文件中提取音频的情况&#xff0c;比如想要将视频中的歌曲或语音内容提取出来&#xff0c;或者电脑上看视频时&#xff0c;总有一些很有意思的BGM&#xff0c;想录下来或者提取出来单独使用&#xff0c;不过有些小伙伴可能不知道…

[abc复盘] abc297 20230409

[atc复盘] abc297 20230409 一、本周周赛总结A - Double Click1. 题目描述2. 思路分析3. 代码实现 B - chess9601. 题目描述2. 思路分析3. 代码实现 C - PC on the Table1. 题目描述2. 思路分析3. 代码实现 D - Count Subtractions1. 题目描述2. 思路分析3. 代码实现 E - Kth …

AOP通知中获取数据

AOP通知中获取数据 之前我们写AOP仅仅是在原始方法前后追加一些操作&#xff0c;接下来我们要说说AOP中数据相关的内容&#xff0c;我们将从获取参数、获取返回值和获取异常三个方面来研究切入点的相关信息。 获取切入点方法的参数&#xff1a;所有的通知类型都可以获取参数 …

【JSP学习笔记】3.JSP 指令及动作元素

前言 本章介绍JSP的指令和动作元素。 JSP 指令 JSP指令用来设置整个JSP页面相关的属性&#xff0c;如网页的编码方式和脚本语言。 语法格式如下&#xff1a; <% directive attribute"value" %>指令可以有很多个属性&#xff0c;它们以键值对的形式存在&am…

数云融合|新手入门,5分钟秒懂开源

目录 一、开源软件开源领域的两大组织&#xff1a;FSF和OSI 二、开源许可证开源意味着免费吗&#xff1f; 三、开源技术应用领域四、总结 一、开源软件 开源即开放源代码&#xff0c;他的核心是源代码公开&#xff0c;任何人都可以查看、使用、修改和分发。与之相对的是闭源&a…

技术+商业“双轮”驱动,量旋科技加速推进全方位的量子计算解决方案

【中国&#xff0c;深圳】4月14日&#xff0c;在第三个“世界量子日”&#xff0c;以“‘双轮’驱动 加速未来”为主题的量旋科技2023战略发布会在线上举办。 本次发布会&#xff0c;量旋科技全线升级了三大业务线产品&#xff1a;其中重点布局的超导量子计算体系产品&#xf…

DolphinScheduler×T3出行 | 打造车联网一站式数据应用交互体验

点击蓝字 关注我们 用户案例 | T3 出行 业务挑战 作为一家车联网驱动的公司&#xff0c;T3出行汇聚了“人、车、路、云”各端的海量数据。为了承载如此多元化的数据以更好地释放数据价值&#xff0c;T3出行构建了以Apache Hudi为基础的企业级的数据湖&#xff0c;并在此之上搭建…

1 分钟给 Siri 升个级!从智Z变身 ChatSiri!

原文链接&#xff1a;https://forum.laf.run/d/79/17 众所周知&#xff0c;Siri 是一个智 Z&#xff01;那么如果能接入大火的 chatGPT&#xff0c;是不是就会从智 Z 变成人工智能&#xff1f;&#xff01; 众所周知&#xff0c;Laf 是一个集函数、数据库、存储为一体的云开发…

第五章_Redis事务

是什么 官网 能做什么 一个队列中&#xff0c;一次性、顺序性、排他性的执行一系列命令 Redis事务 VS 数据库事务 1 单独的隔离操作 Redis的事务仅仅是保证事务里的操作会被连续独占的执行&#xff0c;redis命令执行是单线程架构&#xff0c;在执行完事务内所有指令前是不可…

消息队列kafka及zookeeper机制

目录 一、zookeeper 1、zookeeper简介 2、zookeeper特点 3、zookeeper工作模式及机制 4、zookeeper应用场景及选举机制 5、zookeeper集群部署 ①实验环境 ②安装zookeeper 二、消息队列kafka 1、为什么要有消息队列 2、使用消息队列的好处 3、kafka简介 4、kafka…

【云原生】Kubernetes(k8s)之容器的探测

Kubernetes&#xff08;k8s&#xff09;之容器的探测 一、探测类型及使用场景1.1、startupProbe&#xff08;启动探测&#xff09;1.2、readinessProbe&#xff08;就绪探测&#xff09;1.3、livenessProbe&#xff08;存活探测&#xff09; 二、检查机制三、探测结果四、容器探…

MySQL - 基于SSL安全连接的主从复制

目录 &#x1f341;主从复制的原理 &#x1f341;部署master &#x1f341;部署slave &#x1f341;测试SSL主从复制 &#x1f990;博客主页&#xff1a;大虾好吃吗的博客 &#x1f990;MySQL专栏&#xff1a;MySQL专栏地址 生产环境中一台mysql主机存在单点故障&#xff0c;所…
最新文章