生成式AI与预测式AI的主要区别与实际应用

近年来,预测式人工智能(Predictive AI)通过先进的推荐算法、风险评估模型、以及欺诈检测工具,一直在推高着该领域公司的投资回报率。然而,今年初突然杀出的生成式人工智能(Generative AI)突然成为了全球热点话题。

每个人都在热议如何利用大语言模型(Large Language Model,LLM)进行内容的生成;以及利用客户服务或扩散模型(Diffusion Model),进行视觉内容的创建。那么,生成式人工智能将替代预测式人工智能,成为提高生产力的关键驱动因素吗?

为了回答这个问题,本文将和您一起讨论推动这两大类人工智能方法的关键性机器学习技术,与之相关的独特优势和挑战,以及他们各自适用的真实业务应用。

基本定义

不可否认,生成式人工智能和预测式人工智能是两种强大的AI类型,它们在商业和其他领域都有着广泛的应用。虽然都使用机器学习从数据中获取“知识”,但它们的学习方式和目标有所不同:

  1. 预测式人工智能通常被用于基于历史数据,来预测未来的事件或结果。也就是说,它通过识别历史数据中的模式,并使用这些模式去预测未来的趋势。例如,它可以根据客户购买的历史数据集,通过训练智能模型,以预测次月哪些客户最有可能流失。
  2. 生成式人工智能通常被用来创建诸如:文本、图像、音乐和代码等新鲜内容。它通过从现有的数据中学习,以生成与训练数据类似的新数据。例如,它可以通过在广告样本的数据集上进行训练,进而用于生成新的、创造性的、且有效的广告。

如上表所示,两者的基本区别在于,预测式人工智能的输出是预测,而生成式人工智能的输出是新的内容。以下是几个典型领域的示例:

  1. 自然语言处理(NLP):预测式NLP模型可以将文本分类为诸如:垃圾邮件与非垃圾邮件等预定义的类别,而生成式NLP模式可以根据诸如:社交媒体帖子或产品描述等给定的提示,来创建新的文本。
  2. 图像处理:预测式图像处理模型,如卷积神经网络(CNN),可以将图像分类为预定义的标签,例如:识别杂货店货架上的不同产品。而生成式模型可以利用扩散模型,创建培训数据中没有的新图像,例如:广告活动的虚拟模型。
  3. 药物发现:预测式药物发现模型可以预测一种新的化合物,是否有毒或有潜力作为一种治疗药物。例如:生殖药物类生成式模型,可以创建新的、更高效、更低毒性的分子结构。

我们有必要了解驱动这两种类型AI的不同机器学习算法的各自优、劣势,以便为业务需求选择正确的实现方式。

预测与生成式人工智能算法的工作原理

预测式人工智能通常基于监督式机器学习,来标记数据。此处的标签数据是指使用正确的输入和输出对或序列,来注释数据。模型通过学习输入与输出数据之间的数学关系,来对新的数据进行预测。

预测式人工智能算法可以基于诸如:线性回归、逻辑回归、决策树、以及随机森林等基本的机器学习模型,来预测包括:连续变量(例如,销售量)和二进制变量(例如,客户是否会流失)等各类信息。在某些情况下,由于能够学习到数据中的复杂模式,因此深度学习算法和强化学习在预测式人工智能的任务中,能够表现出卓越的性能,非常适合于预测客户行为、检测欺诈、以及诊断结果等任务。

上图展示了预测式人工智能如何基于一组输入数据,来预测二进制变量--是否患有心脏病的过程。当医疗服务提供商希望使用预测式人工智能,来识别有心脏病风险的患者时,他们可能会使用过往患者的历史数据,来了解不同特征(如,患者的人口统计数据、健康和治疗状况)与心脏病的关系。机器学习模型可以从中发现意外的模式,并提供关于哪些患者更易患心脏病的准确预测。据此,医疗保健提供者可以制定个性化的预防计划。

与预测式人工智能相比,生成式人工智能通常使用无监督或半监督式学习算法,来训练模型。也就是说,无监督学习算法能够从未标记的数据中学习,而半监督学习算法则会从未标记和少量标记的数据组合中学习。总的说来,它们不需要大量标记数据,只需通过屏蔽部分训练数据,然后训练模型,便可恢复被屏蔽掉的数据。例如,大语言模型就是通过将训练数据中的一些标记,随机替换为特殊标记(如,[MASK])来进行训练。然后,此类模型会学习根据前后单词的上下文,以预测被屏蔽的标记。下图展示了BERT架构中的屏蔽过程。

另一种常见的生成式人工智能模型是:被用于图像和视频生成与编辑的扩散模型。这些模型是通过在图像中加入噪声,然后训练神经网络去除噪声,以完成构建。

上图展示的过程是:首先向数据集图像添加噪声,然后训练模型来推断缺失的信息,从而构建出扩散模型。虽然在面对足够大量的未标记数据进行训练时,LLM和扩散模型可以展现优异的性能。然而,为了改善特定用例的结果,开发人员经常会在少量标记的数据上,对生成的模型进行微调,通过强化学习并整合人类的反馈,来减少对抗性反应的数量,进而提高模型的整体性能。

在实际应用中,营销是最先受益于生成式人工智能的业务领域之一。例如,为了生成诸如:博文和社交媒体帖子等创造性的内容,营销机构可以首先选择一个经过预处理的LLM,来证明其用例的可接受性能。然后,他们可以根据机构客户的现有内容数据集对模型进行微调。一旦完成训练,该模型便可被用于生成适合于本机构客户需求的新的内容输出。

优势和劣势

预测式人工智能通常具有如下两方面的主要优势:

  1. 高精度:通过训练,预测式人工智能模型可以在诸如:产品推荐、欺诈检测和风险评估等许多任务中,实现非常高准确性的预测。
  2. 自动化:预测性人工智能可以通过自动化各项任务,来解放人类工作者,让其专注于更具战略性和创造性的工作。

当然,预测式人工智能也存在着如下三个方面的挑战:

  1. 对标签数据的要求:预测式人工智能模型需要已标记的数据,而收集这些数据往往既昂贵又耗时。
  2. 成功的标准过高:在实际应用中,预测性人工智能应用通常被期望具有高准确性,而这对于某些具有复杂影响因素的任务而言,可能很难实现。
  3. 模型的维护:预测式人工智能模型需要定期根据新的数据,予以持续的培训,以保持其准确性。而这对于资源有限的公司来说,可能也是一个挑战。

我们再来看看生成式人工智能算法的优势:

  1. 提高生产力和效率:生成式人工智能可以加快内容的创建、代码的编写、图像的设计与构建过程,从而为企业节省大量时间和金钱。
  2. 创造力:生成式人工智能可以产生人类可能没有想到的新创意。这可以帮助企业开发出新的产品和服务,并能够改进现有的产品和服务。

当然,作为一项非常新的技术,生成式人工智能同样也面临着许多挑战:

  1. 缺乏可靠性:生成式人工智能应用往往存在着高度的不可靠性。它们可能会产生一些虚假的或误导性的信息,这些通常都需要人工的干预。
  2. 对预处理模型的依赖:企业通常需要依赖由外部创建的预处理模型,来生成智能应用。而这很可能会限制他们对于模型及其输出的控制。
  3. 版权和知识产权问题:由于生成式人工智能模型是根据受版权保护的数据进行训练的,因此使用者很可能并不清楚谁真正拥有由模型生成的内容的版权。

可以说,上述两种AI的优、劣势,在很大程度上决定了可以应用的关键领域。

真实世界的应用

我们首先来看预测式人工智能的应用领域。凭借着高度准确的预测能力,以及能够获得足够多的已标记数据来训练AI模型,该预测可以完全自动化各项任务。因此,其适用的场景包括:

  1. 产品推荐系统:预测式人工智能可被用于根据客户过去的购买历史和浏览行为,向其推荐产品。
  2. 欺诈检测系统:预测式人工智能可以协助识别各种欺诈交易和活动。
  3. 风险评估系统:预测式人工智能模型允许企业评估贷款违约、保险索赔、以及客户流失等业务风险事件。
  4. 需求预测系统:通过准确预测对于产品和服务的需求,预测式人工智能够帮助企业规划生产和库存水平,并制定各种营销活动。
  5. 预测性维护系统:此类人工智能可用于预测机器和设备可能发生故障的时间,从而帮助企业规避代价高昂的停机时间,并延长资产的使用寿命。

与预测式人工智能不同,生成式人工智能并不要求我们产生最佳的输出。只要其自动生成的结果“足够好”,仍然可以帮助企业提高生产力和效率。不过,值得注意的是,生成式人工智能应用并不总是可靠,在部署时可能会产生错误的信息或意外的输出。

鉴于该局限性,生成式人工智能最适合于正确性不重要的实验性场合(例如,AI聊天机器人),或者是有人工参与的环节(例如,在发布、发送或执行之前,需要人工检查和编辑模型输出的所有内容)。

下面是生成式人工智能应用的典型示例:

  1. 内容创建:生成式人工智能模型可以加速博客文章、产品描述和社交媒体广告的生成。例如,作者可以提供详细的说明,来指导内容的输出,然后审查和编辑由此产生的内容。
  2. 图像生成:生成式人工智能可用于为产品设计、营销和娱乐,生成逼真的图像和视频。在此基础上,设计师可以查看、编辑和安排这些自动生成的视觉内容,而无需从头开始创建。
  3. 代码生成:生成式人工智能模型可用于为软件应用程序编写代码,或向开发人员建议代码的更改。据此,开发人员可以在执行代码之前,审查和编辑相应的代码。
  4. 药物发现:生成式人工智能可以通过识别新的候选药物并预测其特性,来加速药物的开发,而人类只需控制和保证其质量,以及评估由其生成的药物模型。

小结

综上所述,预测式人工智能凭借着其高精度的自动化流程,以及无需人工监督的特点,目前仍主导着高端人工智能市场。而生成式人工智能是一个新兴的、快速发展的领域,并且有可能彻底改变许多商业领域的应用。虽然生成式人工智能是否会成为可与预测性人工智能相比肩的主要生产力驱动因素尚待观察,但是其潜力是不可小觑的。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/204495.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

如何绕过某讯手游保护系统并从内存中获取Unity3D引擎的Dll文件

​ 某讯的手游保护系统用的都是一套,在其官宣的手游加固功能中有一项宣传是对比较热门的Unity3d引擎的手游保护方案,其中对Dll文件的保护介绍如下, “Dll加固混淆针对Unity游戏,对Dll模块的变量名、函数名、类名进行加密混淆处理&…

Android中添加C或C++代码

1、创建cpp目录,用于存放C和C代码。 2、创建CMake构建脚本CMakeLists.txt文件,将其放在cpp目录中。 # Sets the minimum version of CMake required to build the native library. cmake_minimum_required(VERSION 3.22.1)# Declares and names the pro…

单宁对葡萄酒可饮用性和陈酿潜力会有影响吗?

当在酿酒过程中葡萄酒中的单宁过量时,酿酒师可以使用白蛋白、酪蛋白和明胶等各种细化剂,这些药物可以与单宁分子结合,并将其作为沉淀物沉淀出来。随着葡萄酒的老化,单宁将形成长长的聚合链,氧气可以与单宁分子结合&…

数据挖掘实战-基于word2vec的短文本情感分析(文末送书)

🤵‍♂️ 个人主页:艾派森的个人主页 ✍🏻作者简介:Python学习者 🐋 希望大家多多支持,我们一起进步!😄 如果文章对你有帮助的话, 欢迎评论 💬点赞&#x1f4…

【PPT模板合集】关于自制内容的PPT模板合集,包括原创的PPT及改良内容的PPT,适合科研/比赛/工作

【PPT模板合集】关于自制内容的PPT模板合集,包括原创的PPT及改良内容的PPT,适合科研/比赛/工作 零、前言一、校园层面的PPT模板1.1 各种毕业答辩1.2 夏令营答辩1.3 奖学金答辩1.4 比赛/项目答辩 二、学术层面的PPT模板2.1 学术汇报2.2 会议海报类型 三、…

使用VScode通过内网穿透在公网环境下远程连接进行开发

文章目录 前言1、安装OpenSSH2、vscode配置ssh3. 局域网测试连接远程服务器4. 公网远程连接4.1 ubuntu安装cpolar内网穿透4.2 创建隧道映射4.3 测试公网远程连接 5. 配置固定TCP端口地址5.1 保留一个固定TCP端口地址5.2 配置固定TCP端口地址5.3 测试固定公网地址远程 前言 远程…

网站监控有什么作用?

科技改变生活,科技的发展让我们的生活越来越精彩丰富,数据中心机房监控系统也可以称为“自我监控系统”,主要是针对机房所有的设备及环境进行集中监控和管理的,其监控对象构成机房的各个子系统:动力系统、环境系统、消…

SpringBoot+Redis获取电脑信息

获取电脑信息 测试 System.getProperties(); System: 是Java中的一个内置类,用于提供与系统相关的功能和信息。这个类中包含了一些静态方法和常量,可以让您方便地访问和操作系统级别的资源。 getProperties(): 是一个静态方法,它返回一个表示…

学习笔记小结

redis-cluster集群 redis3.0引入的分布式存储方案 集群由多个node节点组成,redis数据分布在这些节点当中。 在集群之中分为主节点和从节点 集群模式当中,主从一一对应,数据的写入和读取与主从模式一样,主负责写,从…

实时沟通,实时增长:企业使用WhatsApp Business的不二选择

在数字化浪潮中,WhatsApp Business崭露头角,成为企业与客户之间沟通的新利器。今天运营坛将和大家深入探讨WhatsApp Business在2023年为企业带来的机遇,从增长率、客户群体、功能特性以及优势等方面剖析为何企业需要充分利用这一强大工具。 W…

VirtualBox上安装CentOS7

基础环境:宿主机是64位Windows10操作系统,通过无线网访问网络。 macOS可以以类似方式进行安装,不同之处见最后补充。 Step1 安装VirtualBox VirtualBox是一款免费、开源、高性能的虚拟机软件,可以跨平台运行,支持Wi…

突发,合肥一废品回收站发生火灾,富维AI神器助力防灾

昨晚,合肥一废品回收站突发火灾,火光冲天,烟雾蔓延。幸亏及时发现,消防人员迅速到场,控制了火势。这起事件让我们再次认识到火灾报警的重要性。而在这方面,北京富维图像公司的FIS智能图像识别系统就发挥了巨…

1+x中级网络运维实验题

任务 1: 设备命名 为了方便后期维护和故障定位及网络的规范性,需要对网络设备进行规范化命名。请根据 Figure 3-1 实验考试拓扑对设备进行命名。命名规则为:城市-设备的设置地点-设备的功能属性和序号-设备型号。例如:处于杭州校…

基于 Gin 的 HTTP 代理 Demo(2)

一周后勘误: 我这里实现的严格来说还是 HTTP 代理,只不过是通过隧道的方式传输非 HTTP 的流量,这里是 HTTPS 流量。尽管它可以传输 HTTPS 流量,它也不算是 HTTPS 代理。 上次写了 基于 Gin 的 HTTP 代理 Demo 之后,对…

ant design vue3 处理 ant-card-head ant-tabs靠左边对齐之has选择器不生效

火狐浏览器是不支持has的。 解决方法:通过position来解决。

解析编程中的技术迷题:常见挑战与应对策略

前言 在数字化时代的浪潮中,编程已经成为了一项至关重要的技能。无论是在软件开发、数据分析、人工智能还是互联网领域,编程都扮演着不可或缺的角色。作为一种创造性的活动,编程不仅仅是代码的书写,更是一种解决问题和创新的思维方…

软件测试的测试文档怎么编写?

在软件测试中的流程中,测试文档也是一个重要的流程,所以测试人员也需要学习测试文档的编写和阅读。 一定义: 测试文档(TestingDocumentation)记录和描述了整个测试流程,它是整个测试活动中非常重要的文件。…

【JavaEE初阶】 详解HTTPS协议加密过程

文章目录 🌴HTTPS协议是什么?🎄运营商劫持事件🎋HTTPS的工作过程🚩对称加密🚩非对称加密🚩引入证书🚩完整流程 🌳HTTPS加密总结⭕总结 🌴HTTPS协议是什么&…

基于Netty实现TCP通信

创建一个Maven项目添加下面依赖 <dependencies><!-- 日志依赖 --><dependency><groupId>org.slf4j</groupId><artifactId>slf4j-api</artifactId><version>1.7.32</version></dependency><dependency><g…

帮亲戚个忙,闲来有事用php写个58商铺出租转让信息抓取

最近亲戚想做点小超市生意&#xff0c;但是又不懂互联网&#xff0c;信息获取有点闭塞。知道我身在互联网大潮中&#xff0c;想让我帮忙看看网上有没有商铺转让的。心想&#xff0c;这不是小菜一碟&#xff0c;大显身手的时候来了&#xff0c;大概去58瞅了瞅&#xff0c;这玩意…
最新文章