AI PC行业深度研究报告:AI PC革新端侧AI交互体验

今天分享的人工智能系列深度研究报告:《AI PC行业深度研究报告:AI PC革新端侧AI交互体验》。

(报告出品方:华创证券)

报告共计:28页

点击添加图片描述(最多60个字)编辑

一、硬件端与内容端持续创新,AI PC 或有望成为首个大批量落地的 AI 终端

(一)联想首推 AI PC,2024 年 9 月有望上市

联想 All For AI,展示丰富人工智能创新成果。2023 年 10 月 24 日,在联想创新科技大 会(Lenovo Tech World 2023)上,联想集团董事长兼 CEO 杨元庆展示了联想首款 AI PC、 大模型压缩技术、人工智能双胞胎(AI Twin)等一系列人工智能创新科技成果。联想的 AI Twin 可以通过压缩模型使大模型终端设备上离线运行,在旅行规划需求下,AI Twin 会参考用户之前的旅行日记和笔记,为用户提供比公共模型更个性化的旅行计划。

基础模型包括三类,有助于分层提供不同类型服务。基础模型是在与人类价值体系相一 致的大量数据规模上训练的大型 AI 模型,因此它可以适应广泛的下游任务。基础模型分为公共、私人和个人三种,公共基础模型(Public FM)是所有人都可以获得的,私人基础模型(Private FM)是为了执行企业特定任务将信息保留在企业里的,个人基础模型 (Personal FM)可以基于个人数据提供个性化答案。

实现人工智能基础模型三个核心技术,联想将终端 AI 推理变为可能。在设备上集成智能 对于实现 AI 的全部潜力,即提供更高即时性、可靠性、个性化、安全性和隐私性至关重 要,能够在设备本地高效运行多个并发 AI 工作负载的技术是关键。其中包括三项核心技术:(1)私人模型的微调:首先使用公共数据进行训练得到公共基础模型(Public FM),它可 以执行一般的任务。然后通过使用企业特定数据进行额外训练,由此私人模型 (Private FM)可以理解公共领域任务也可以理解企业特定的任务。 (2)个人基础模型的模型压缩:发现基础模型中的耦合结构,评估这些结构的重要性。对于重要的 结构,分配更多 bits 来量化,对于不太重要的结构分配较少的 bit。通过这种联合修 建和量化算法,可以显著减小基础模型的大小,从而放进 PC 或智能手机中。(3)混合 AI 框架的数据管理和隐私保护:评估这个任务是公开的还是私人的,如果是公 开的,可以将此任务分派给所有基础模型。如果包含企业特定信息或个人信息,执行任务理解、任务分析、关键字屏蔽和取消屏蔽等操作,最后再使用这个混合 AI 框 架将所有内容重新组合成一个完整答案。

联想将与合作伙伴共同建立混合 AI 生态,首款 AI PC 有望于明年 9 月发布。未来的 AI 将是公共、私人和个人基础模型的混合体,联想将和所有合作伙伴一起建立混合 AI 生态 系统。联想将提供企业 AI 双胞胎和个人双胞胎 AI 两类服务;对于企业用户,联想将通过混合 AI 和域优化服务满足企业数据保护和安全需求;对于个人用户,联想将通过在终 端设备方面的优势,以混合方式提供模型服务,最大限度提高用户效益。

(二)从 Smart PC 到 AI PC,AIGC 驱动 PC 智能化新发展

Smart PC 推出已久,受限于成本压力普及缓慢。几年前就开始有厂商积极探索 Smart PC (智慧 PC)的使用场景,Smart PC 主要从应用场景出发(Always on Always),例如:人 机交互,包括语音智能唤醒、免接触式场景和开盖开机等功能。然而受限于成本和算力, 推进速度相对较慢。据群智咨询数据,为实现 PC 端智能化的自然语言交流,单在硬件成 本上至少需要额外付出约 2.7 美元左右来满足精确的语音录入与处理功能,使品牌方的 成本压力大大增加。混合 AI 从云到端,助力 Smart PC 向 AI PC 转化。AIGC 的迅速发展可有效解决 Smart PC 的成本压力问题,即:云端+本地端协作。利用云端的大数据处理能力丰富本地端的 PC 使用场景,依托于云端算力来提升本地性能平衡,会大大的助力 Smart PC 向着 AI PC 的方向进一步持续转化,提供更多的应用场景,这也对 AI PC 提出了本地端与云端混合发展的要求。

相比于传统 PC,AIPC 功能丰富且效率更高。传统 PC 仅能实现基础的数据处理和计算 功能,智慧 PC 可以实现本地特定场景的优化功能,而 AIPC 功能更加丰富,具备自然语言处理、图像识别等多种功能。同时本地+云协同工作,大幅提高运行效率,使得离线条 件下也能使用 AI 功能。交互方面,AIPC 提供简易化的操作界面,对用户技能要求较低, 让更多的用户能够使用人工智能来提高效率。

(三)隐私保护与低延迟催生 AIPC 需求,软硬件持续迭代为产品落地创造条件

大模型存在数据泄露等安全隐患,是企业及个人用户的核心关注点。2023 年 3 月 ChatGPT 首次遭遇了重大个人数据泄露,很多网友在 ChatGPT 网页左侧的聊天记录栏中 出现了他人的聊天记录内容。除此之外,今年 3 月自三星电子允许部分半导体业务员工 使用 ChatGPT 开始,短短 20 天有三起机密资料外泄事件。据 Cyberhaven 数据,在员工 直接发给 ChatGPT 的企业数据中,有 11%都是敏感数据。

终端 AI比云更安全,且时间延迟较低。目前常用的 AIGC 都是在云上实现,需要将个人数据上传到网络,存在泄露隐私的隐患。而未来 AIPC 的部分推理功能将发生在终端侧,用户既可以享受到 AIGC 带来的生产力提升,也无需担心上云导致的隐私泄露。对用户来说,云上的公共知识可以为其所用,但自己的人工智能数据无需分享。除安全性之外,终端 AI 节省了数据传输时间,大幅降低时间延迟。

多家厂商加速研发 AIPC,2024 有望迎来 PC 重大发展机遇。除联想之外,多家头部 PC厂商也在进行 AIPC 相关研发和合作。惠普电脑 CEO Enrique Lores 表示目前正在研发支持 AI 能力的 PC,称当前正与所有关键软件服务商和芯片供应商合作,将重新设计PC 的架构。戴尔与英伟达合作推出新的 AIGC 解决方案,同时戴尔将提供新的硬件设置、托管服务平台和计算机,以更快地运行客户所创建的生成式 AI项目。Acer 品牌创办人施振荣表示,Acer 目前已经与 CPU 厂商展开合作,预计将把 AIGC 或其他 AI 应用导入到终端设备上,相关 AI笔记本方案会在 2024、2025 年陆续推出。

2024 或将迎来 AIPC 规模出货元年,软硬件持续选代为产品落地创造条件。据群智咨询数据,预计 2024年全球AI PC 整机出货量将达到约 1300 万台。在2025 年至 2026年,AI PC 整机出货量将继续保持两位数以上的年增长率,并在 2027 年成为主流化的 PC产品类型,这意味着未来五年内全球 PC 产业将稳步迈入 AI时代。由于 AIPC 产品对硬件和软件基础设施的要求均有所提高,软硬件仍需持续迭代为产品落地创造条件。

二、硬件端:AI PC 催化硬件端迭代升级,英特尔 AI PC 芯片将于年底落地

(一)可获取性及安全性是办公领域核心问题,AI 从云端走向终端

人工智能引发数据安全问题,需平衡技术应用和隐私保护。随着人工智能技术的不断发 展和 AIGC 的应用,大量的个人和企业数据被采集、处理并传输到云端,而将数据传输 到云端存在数据泄露的风险。在应用人工智能技术的同时,仍需关注如何做好数据隐私保护问题。

AI从云端走向终端部署,最大幅度保障数据安全和运行稳定性,边缘计算是指发生在网络边缘的计算,更靠近数据源,而云计算发生在数据中心。云计算通常具有高可用性,高性能和高伸缩性,可以处理大规模数据和应用程序;而边缘计算通常具有低延迟、高带宽和实时功能,可以支持更多实时应用场景。除此之外,由于边缘计算中仅向云端传输少量信息或不传输信息,隐私性和安全性较高。同时,由于边缘 AI 不受网络访问限制,可离线使用,可充分保障系统稳定运行。

多种方法进行大模型压缩,从而将其部署至终端设备。目前常见的模型压缩有三种方式, 包括知识蒸馏、量化和权重剪枝。可以在不显著降低模型性能的前提下,节省存储空间、 提高计算效率、加速推理过程,使大型 AI 模型更容易部署到边缘设备或其他低功耗环境 中,从而拓展 AI 技术的应用领域。  知识蒸馏:通过训练轻量级模型(学生模型)来模仿重量级模型(教师模型),可以将大型 AI 模型的知识迁移到轻量级模型中,从而实现模型压缩。  量化:将浮点数权重参数转换为较低精度整数,从而降低模型的存储和计算需求。  权重剪枝:删除模型中较小的权重参数,从而减小模型的大小。为了防止模型过拟 合的情况,在压缩过程中需要加入正则项来平衡模型的泛化性能。

压缩模型终端运行的效果并不弱于原始大模型,有望催化混合 AI 架构。大模型的训练效 果并不是参数越多越好,较小参赛的模型经过微调也能具备相似甚至更好的效果。据上海人工智能实验室发表的论文《LLaMA-Adapter: Efficient Fine-tuning of Language Models with Zero-init Attention》的研究结果,基于 70 亿参数的模型 LLaMA-Adapter 在微调 180 万个参数后,回答问题的正确率高于多数大型模型,同时在 SOC(Social Science)领域的效果非常突出。

(二)终端离线 AI 对处理能力提出更高要求,硬件仍需持续迭代

高通实现安卓手机上跑十亿参数大模型,证明大模型在本地终端运行的可能性。2023 年 2 月 23 日,高通全球首次成功在搭载了骁龙芯片的安卓手机上运行了 Stable Diffusion。 Stable Diffusion 可以基于大模型从文本生成图片,其模型参数超过 10 亿个,计算量是智 能手机上运行的典型工作负载大小的 10 倍以上,而正是由于模型庞大、算力需求高、能耗高企,此前主要局限在云端运行。而搭载骁龙芯片的手机可以直接运行参数规模超过 10 亿的 Stable Diffusion,且只需要 15 秒左右就可以出图,精确度与云端处理接近。

边缘侧 AI 对终端的处理能力提出更高要求,终端处理器仍需持续迭代。以苹果 Siri 为 例,早期 Siri 在离线情况下仅支持通过预设的语音唤醒信号实现语音唤醒。2018 年苹果推出 A12 芯片,采用台积电 7nm 制程,NPU 由双核升级到八核,NPU 内核的面积是 A11 的 3.16 倍。搭载 A12 芯片的 iPhone XS 首次支持 Siri 离线运行,可以在离线条件下完成拨打电话、打开特定应用等预设简单请求。随着未来在终端运行大模型的复杂度持续提 高,终端处理器仍需持续迭代。

AI PC 带动散热、存储及外观设计创新,硬件仍需持续迭代。除了核心处理器外,AI PC 对笔记本电脑的其他零部件亦提出更高的要求。在终端运行大模型首先要解决散热问题, 要重新设计机器外壳和结构件,同时采用更好的散热材料。存储方面,为了提高数据传 输速度及存储容量,需采用更优质的存储器件。AI PC 带动笔记本电脑一系列的迭代与创新,有望驱动 PC 零部件价值量提升。

(三)具备 AI 功能的 AI PC 芯片将于年底推出,AI PC 加速落地

英特尔首款内置神经网络处理器的消费级芯片即将上市,消费级 AI 芯片走向市场。英特尔 Meteor Lake(14 代酷睿)将于 2023 年 12 月 14 日上市,该芯片首次将神经网络处理 单元(NPU)集成到 PC 处理器中。NPU 与 CPU、GPU 的主要区别在于学习能力,NPU 可 通过学习用户操作、计算任务属性,做出相应的预判来弹性调用 CPU 与 GPU 的运算能 力,大幅提升性能,同时降低功耗。该芯片采用新的 Intel4 制造工艺,相较于 Intel 7 制程工艺的 408nm 高性能库高度,Intel 4 的 240nm 达到了 2 倍的高性能逻辑库面积缩减。

英特尔宣布启动 AI PC 加速计划,构筑 AI PC 核心硬件基础。英特尔在近期“英特尔 on 技术创新大会”期间宣布,正式启动首个 AI PC 加速计划。英特尔将联合独立硬件供应 商(IHV)和独立软件供应商(ISV),利用英特尔在 AI 工具链、协作共创、硬件、设计 资源、技术经验和共同推广等方面的资源,在 2025 年前为超过 100 万台 PC 带来 AI 特 性,并由计划 12 月 14 日发布的英特尔酷睿 Ultra 处理器率先推动。处理器的性能是终 端运行 AI 及 AI PC 渗透的核心技术瓶颈,英特尔的布局构筑 AI PC 核心硬件基础,有望 驱动 AI PC 快速普及。

三、内容端:AIGC 快速发展,微软 Copilot 推出为 AI PC 内容端创造环境

(一)ChatGPT 使 AI 商业化初步落地,或可推动 AIGC 行业进入快速发展期

AI 被视为“第四次科技革命”,开启新一轮技术创新周期。人工智能概念最早于 1956 年 被提出,多年以来产业历经几轮技术快速发展周期。2012 年 AlexNet 神经网络模型问世, 成为一轮发展起点,并开启了 AI 在各行各业的应用,被视为人工智能 1.0 时代,但当时 仍存在模型碎片化等问题。2017 年 Google 团队提出的 Transformer 架构,开启了大模型为主流算法的人工智能 2.0 时代,模型参数呈现指数级增长。自 2018 年起,新一代 AI 技 术正在开始全新一轮的技术创新周期,而 GPT 也正是由此时诞生。

ChatGPT 代表通用人工智能突破的可能性,使得 AI 的“商业化”初步落地。ChatGPT 引发全球轰动的核心是代表着 AI 正在从感知智能向认知智能发展,代表通用人工智能突破 的可能性,正是“通用性”使得 AI 的“商业化”能够初步落地。此前运用人工智能的场景都 是专用人工智能模型,往往只适用于某具体领域;而 ChatGPT 及 GPT4.0 代表了人工智 能通用大模型方向的最新进展,“通用性”使得 AI 的“商业化”能够初步落地,而 AI 的通 用、商业化应用才能为各行各业具体赋能。目前 AIGC 的主要模式有文本生成、图像生成、音频生成,策略生成,跨模式生成及 Game AI。基于多种模式,AIGC 已应用于法律、 金融、工业、游戏等多种领域。

ChatGPT 具备爆款特性,或可推动 AIGC 行业进入快速发展期。众多学者将 ChatGPT 的 出现类比为“AI 的 iPhone 时刻”,关键在于 iPhone 和 Android 的推出加速了手机进入通用 化、智能化、商业化的民用时代。ChatGPT 的出世一度被认为是 iPhone 4 之后的又一次 革命,深刻改变人类生活和互联网格局。技术上,ChatGPT 一面市就展现出高完整度、 高体验性和高平台性,是成熟到一定程度的产物,而 iPhone 4 在软件和硬件方面都是高 标准、高适配;市场反应程度上,二者在短时间内都得到迅速普及,具有里程碑意义;时 代特征上,ChatGPT 和 iPhone 4 具有分别开启智能互联网时代和效率革命;二者都为用 户带来了效率的提升,iPhone 4 让大家的生活更高效、便捷、多样化,ChatGPT 则更直接 地为人类解决问题,扩展思维的多样性。

(二)生产力提升为 AIGC 率先渗透领域,PC 有望成为为 AIGC 核心交互入口

孪生编辑创作三大能力构建 AIGC 能力闭环。据中国信息通信研究院,AIGC 主要包括 三大核心能力,分别为孪生、编辑和创作。深度神经网络技术在大模型和多模态两个方 向上的持续突破,推动 AIGC 技术演化出智能数字内容孪生能力、智能数字内容编辑能 力和智能数字内容创作能力三大前沿能力。  孪生能力:将现实世界中的物理属性和社会属性高效、可感知地进行数字化。  编辑能力:高效率仿真和低成本试错为现实世界的应用提供快速迭代能力。  创作能力:算法创作能力的自我演化支持海量内容生态。

报告共计:28页

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/235880.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

mybatis多表映射-对多关联

1、建库建表 create database mybatis-example; use mybatis-example; create table t_book (bid varchar(20) primary key,bname varchar(20),stuid varchar(20) ); insert into t_book values(b001,Java,s001); insert into t_book values(b002,Python,s002); insert into …

【SpringBoot教程】SpringBoot 实现前后端分离的跨域访问(CORS)

作者简介:大家好,我是撸代码的羊驼,前阿里巴巴架构师,现某互联网公司CTO 联系v:sulny_ann(17362204968),加我进群,大家一起学习,一起进步,一起对抗…

xtts和ogg不选择?

不选择ogg的理由: 1.需要在源端创建用户赋权,启用数据库最小日志,附加日志等操作--对生产影响较大 2.外键约束过多,割接启用可能很慢https://www.modb.pro/db/201126--割接停机时间影响 3.初始化配置expdp导出可能快照过旧&#x…

基于Java swing的医院信息管理系统(Java毕业设计)

大家好,我是DeBug,很高兴你能来阅读!作为一名热爱编程的程序员,我希望通过这些教学笔记与大家分享我的编程经验和知识。在这里,我将会结合实际项目经验,分享编程技巧、最佳实践以及解决问题的方法。无论你是…

秒级监控、精准迅速:全面保障业务可用性 | 开源日报 No.101

louislam/uptime-kuma Stars: 41.1k License: MIT Uptime Kuma 是一个易于使用的自托管监控工具,主要功能和核心优势包括: 监控 HTTP(s) / TCP / HTTP(s) 关键词 / HTTP(s) Json 查询 / Ping / DNS 记录等服务的可用性提供时尚、响应迅速且良好用户体验…

docker配置连接harbor私有仓库

一、前言 以下分为两种情况说明docker对harbor私有仓库的访问配置,一种是harbor使用自建证书配置https,一种是使用公有证书配置https 二、docker配置 harbor使用自建证书的情况 使用自建证书对harbor进行https配置,docker会将该仓库识别成不…

客服工单系统推荐:哪个最适合您?

客服工单系统是企业的业务过程的“保安”,保障业务流程的顺利开展,同时保障企业客户的权益。所以,市场上有越来越多的企业纷纷配置了客服工单系统,以提供客户服务质量。 对于有购买意向的中小企业来讲,需要关注哪些因…

pycharm中py文件设置参数

在py文件中右键 直接对应复制进去即可

供应链管理痛点大解析!内附解决方案

供应链是指涉及产品或服务生产、运输、分销和最终交付给客户的过程。 用一个汽车制造的例子来帮助大家理解: 原材料采购: 汽车制造商需要从供应商处采购制造汽车所需的原材料,例如金属、橡胶、塑料和玻璃。生产制造:获得原材料&…

关于mysql高版本使用groupby导致的报错

在开发时,遇到mysql版本在5.7.X及以上版本时使用group by 语句会报以下的错误 Caused by: com.mysql.jdbc.exceptions.jdbc4.MySQLSyntaxErrorException: Expression #1 of SELECT list is not in GROUP BY clause and contains nonaggregated column business_typ…

班级管理的重要性

班级管理,就像是一座桥,连接着学生和老师,它的重要性不言而喻。 营造良好的学习氛围 班级管理不仅仅是维护秩序,更是营造一个积极向上的学习氛围。一个好的班级管理,能让学生更加专注于学习,提高学习效率。…

Stable Diffusion WebUI训练Lora测试XYZ显示例图

方式一 1.1 选择模型放入目录 将模型放入sd项目的models\Lora\目录,尽量保持和其他模型分开。 sd中显示如下: 1.2 脚本X/Y/Zplot选择 X轴类型:提示词搜索/替换 X轴值:NUM,000001,000002, 000003, 000004, 000005, 000006, 000007, 000008, 000009, 000010 Y轴类型:提…

[MySQL] SQL优化之性能分析

🌈键盘敲烂,年薪30万🌈 目录 一、索引优化 1、索引是什么: 2、索引的数据结构: 3、索引种类: 4、sql分析(回表查询) 二、定位慢查询语句 1、慢查询日志 2、profile详情 3、…

数字化合纵连横:跨境电商的多维商业布局

跨境电商在数字化时代崛起,不再局限于传统的边界,而是通过数字化手段实现了合纵连横的多维商业布局。这种布局不仅推动了国际贸易的创新,也为企业在全球范围内发展提供了更为广阔的空间。本文将深入探讨跨境电商如何通过数字化手段实现合纵连…

Android:The emulator process for AVD Pixel_2_API_29 was killed

The emulator process for AVD Pixel_2_API_29 was killed 报错描述: 第一次安装Android studio好不容易解决gradle启动模拟器又出现了以下错误 The emulator process for AVD Pixel_2_API_29 was killed原因一: 需要安装Intel x86 Emulator Acceleer…

【C语言快速学习基础篇】之二控制语句、循环语句

文章目录 一、控制语句1.1、if...else...单条件语句1.2、if...else if...else...多条件语句1.3、switch...case 二、循环语句2.1、for循环2.2、while循环2.3、注意:for循环和while循环使用上面等同2.4、do while循环2.4.1、while条件成立时2.4.2、while条件不成立时…

2023年【广东省安全员C证第四批(专职安全生产管理人员)】考试题及广东省安全员C证第四批(专职安全生产管理人员)报名考试

题库来源:安全生产模拟考试一点通公众号小程序 广东省安全员C证第四批(专职安全生产管理人员)考试题参考答案及广东省安全员C证第四批(专职安全生产管理人员)考试试题解析是安全生产模拟考试一点通题库老师及广东省安…

别划走!3分钟看懂 Git 底层工作原理

这是一篇能让你迅速了解 Git 工作原理的文章,实战案例解析,相信我,3 分钟,绝对能够有收获! Git 目录结构 Git 的本质是一个文件系统(很重要,记住这句话,理解这句话)&am…

浅谈 USB Bulk 深入浅出 (1) - USB 传输模式 及 何谓 USB bulk

来源:大大通【阿福的随笔】浅谈 USB Bulk 深入浅出 (1) - USB 传输模式 及 何谓 USB bulk 1. USB 传输模式有哪些 USB 是即插即用使用差动信号的装置界面,是以 端点 ( Endpoint ),做为传输装置的输出入端,透过不同的端点 ( Endp…

工作中常用的RabbitMQ实践

目录 1.前置知识 准备工作 2.导入依赖 3.生产者 4.消费者 5.验证 验证Direct 验证Fanout 验证Topic 1.前置知识 rabbitmq有五种工作模式;按照有无交换机分为两大类 无交换机的:简单队列(一对一,单生产单消费)、工作队列(工作队列有轮训分发和公…