AIGC技术带给我们什么?基于AIGC原理及其技术更迭的思考

AIGC技术带给我们什么?基于AIGC原理以及技术更迭的思考

前言

AI,这个词在如今人们的视野中出现频率几乎超过了所有一切其他的事物,更有意思的是,出现频率仅次于这个词的,几乎都会加上一个修饰亦或是前缀——AI,没错,还是它。

正值五一假期,我们试着在网上搜索关键词的相应指数,分别对“ai”和“五一”两个词进行对比,我们发现:顶峰时期的”五一“一词也几乎只是达到”ai“的日常水平。(数据仅供参考,具有极强的范围局限性——尽管如此,我相信人们如今对于ai的讨论已作为家常便饭)

在这里插入图片描述

也许在五年前,不,三年前,AIGC这门技术还并没有起色,甚至可以说在所有技术领域之中并没有得到实际性的应用和实践。但是仅仅过了一两年——也就是在2022年11月30日,ChatGPT的发布彻底改变了人们对AI,对AIGC的看法,甚至可以说它改变了AIGC这门技术的基本含义以及实际意义。
在这里插入图片描述

AI是什么?这个对于我们这些臭写代码的来说并不陌生,其实它的英文本意就已经很好地解释了其功能和意义:Artificial Intelligence,人工智能,即研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。也就是说它是有助于的。

而AIGC就是由AI自动创作生成的内容AI Generated Content)。它即是AI的衍生学科,由AI技术赋能,为了更好地对AI进行探索和发展,人们创造了这门学科。

像我们如今使用的ai工具例如ChatGPT、文心一言、Sora等等,都是基于AIGC技术而产生的应用和服务。可见它致力于为人类提供更好的创造。

如今网络上随处可见的AI生成图片、视频、音乐,AI合成虚拟人,前段日子火爆全球的游戏《幻兽帕鲁》等等,无疑是AIGC所带给人们关注效果最为显著的杰作,也无疑是人们收益颇丰的技术支持,无论是针对开发者还是消费者。它带来了原本应是人类自身所该带来的情绪价值:歌曲的创作,某张历史图片的复原;同时也带来了无限的物质价值:开发者大赚一笔,关注者进行着无意间的流量消费以及资金开销。毫无疑问,AIGC技术给人类社会带来了众多方面的改革和变化,也实实在在地改变了人们看待周遭事物的想法。

但是,随之而来的争议也是滔滔不绝,引发的思考也是源源不断。

”AI生成的艺术作品无法取代人类情绪价值的付出“,”AI并不能取代人类千万年来在社会各个方面的创作以及思考“。人们对于AIGC技术的”入侵“,很难不表现出不适应或者说是不习惯,并且针对其引发的思考也是各执一言,各有看法。那么针对AIGC对于人类社会的浸入,我们究竟该如何看待呢?


AIGC的前世今生:历史变革与技术发展

下图很好地概括了AIGC的前世今生:

在这里插入图片描述

AIGC的发展理论上可以分为三个阶段:早期萌芽阶段(1950s-1990s)沉淀积累阶段(1990s-2010s)快速发展阶段(2010s-至今),但我认为快速发展阶段实际上可以又分为2022年前后两个阶段(ChatGPT的问世带来了新的AIGC)。

总的来说,AIGC的发展历史是随着科技水平和研究技术的改变而改变的,早期的AIGC仅仅只是局限于计算机自主创作以及简单的人机对话,但是并不成熟;后来我认为的一个里程碑事件就是手机的出现带动了语音助手的发展,例如Siri、小米的小爱同学,这些都是基于AIGC技术面向对话的成果,这很大程度表明了AIGC对于人类生活的帮助是不可忽视的,毕竟涉及到物联网、大数据、云等等,都可以与之良好结合。直到后来的ChatGPT,实际上针对这类文本创作助手,早已有相应研究和科研成果,但真正具有跨时代、开辟意义的只在OpenAI的GPT问世,它带来了一个新的变革,一个新的人机对话方式,新的AIGC。

AIGC以其多元化的应用场景、并联使用的技术融合、迎合生活的操控方式,在未来的发展必将不可限量,未来的历史也是历史,将会有更多历史性的事件等待着我们。

AIGC三把斧:AI核心技术

AI的三项核心技术包括:深度学习、神经网络生成式对抗网络(GAN)。而由于AIGC本身就是基于AI的,所以说这三项核心技术同属于AIGC也不为过。当然,更严谨的说法包括基础模型和预训练大模型两个模块,但这是针对模型来进行分类,在此我们介绍的是技术层面。

神经网络

人工神经网络(Artificial Neural Network,即ANN ),是20世纪80 年代以来人工智能领域兴起的研究热点。它从信息处理角度对人脑神经元网络进行抽象, 建立某种简单模型,按不同的连接方式组成不同的网络。结构类似于像数据结构中的星图。

神经网络模拟的就是人类的神经网络,它的不同点犹如神经元,可以接受和传递信息,它的不同线由于神经纤维,可以控制信息的流动。

深度学习

深度学习(DL,Deep Learning)是机器学习(ML,Machine Learning)领域中一个新的研究方向,它被引入机器学习使其更接近于最初的目标——人工智能(AI,Artificial Intelligence)。

为了完善和加强神经网络,深度学习将其分为多层从而进行分工合作,犹如大脑中的不同区域负责不同的功能。这样做的目的是使机器能够更加有规律和高效地处理和理解问题。

在这里插入图片描述

生成式对抗网络(GAN)

近年来,深度学习在很多领域的都取得了突破性进展,但大家似乎发现了这样的一个现实,即深度学习取得突破性进展的工作基本都是判别模型相关的。2014年Goodfellow 等人启发自博弈论中的二人零和博弈,开创性地提出了生成对抗网络(GAN)。

GAN包括了一个生成模型(Generator)和一个判别模型(Discriminator),前者的作用是创造,例如文本作品、歌曲等;后者的而作用是判断,用于判断这些作品是否是真实存在的(否则是生成模型所产生的)。

可以这么理解:生成器和判别器互相对抗和挑战,从而更好地完善自己,在努力朝着生成器不被判断器识别出、判断器总是能识破生成器的方向前进——这似乎在趋于一个中间的平衡,但二者实际上是互相矛盾的。

在这里插入图片描述

AIGC技术在各领域的应用

我们先来探讨一下AIGC的技术应用
人工智能生成内容技术AIGC)作为人工智能领域的重要分支,其在各个领域的广泛应用潜力难以估量。其主要的应用在于以下几个方面:

  1. 内容创作:AIGC技术被广泛应用于新闻报道、广告文案、电商商品描述等领域,能够快速生成大量高质量的内容,提高创作效率。
  2. 营销推广:在商业领域,AIGC技术被用于生成个性化的营销内容,根据用户数据和行为进行精准定制,提升品牌曝光和用户参与度。
  3. 客户服务:许多企业利用AIGC技术开发智能客服系统,能够自动回复用户问题、提供产品信息和解决常见问题,提升客户服务效率。
  4. 教育领域:AIGC技术被应用于智能辅导系统,能够根据学生的学习情况生成个性化的学习内容,提高学习效果。
  5. 医疗领域:在医疗影像诊断和疾病预测方面,AIGC技术也发挥着重要作用,能够帮助医生更准确地诊断疾病和制定治疗方案。

不知道你是否能够看出来,对于应用的介绍是使用ChatGPT写出来的。不夸张地说,它确实将AIGC的应用进行了大致的概括,并且较为全面——这也基于我给它提供的几个提示词:简短以序号形式——是的,仅仅是如此简单的几个词,我们就可以对其语言风格以及输出内容进行控制和管理。而这,实际上就是AIGC的最为核心的应用,可以说AIGC技术就是围绕它来展开的——内容创作

1.内容创作

像例如ChatGPT这类的文字创作工具,它们被用于内容创作,服务的对象是整个人类群体——因为人类社会离不开文字。音乐、影像同样是这样。

在生成式AI技术的使用中,又包括以下几个方面:

1) 文本生成

不可否认的是,AI生成的速度相较于人类作者更快、更高效,而生成内容的质量也是基于已有的数据支持,具有一定的权威性和真实性。在文本上的使用通常会有益于作家、博客、代码编写者等等。对于他们来说,AIGC助手的帮助让他们写作的效率大大提高,避免了冗长不必要的内容书写,并且还能帮助他们润色自己的文章,提高代码的可读性和健壮性等。除此之外,由于AI对于数据的收集范围之广,甚至能够轻松地通过各种面向人类的考试,例如心理类,法律类等等,所以它同样也可以勉强担当一个心理治疗师、律师甚至是朋友(当然,只要你可以接受你的朋友只是一个对话框)。

2) 音频生成

包括语音合成、音乐创作和声音设计等等,Suno等音乐创作 AI 程序允许用户使用 AI 创建原创音乐曲目。经过观察,我们会发现AI赋能音乐创作确实能够出现某些效果超群、技术高超的编曲,例如这首原本传统的《春天在哪里》,作为音乐爱好者,不得不说它的爵士乐味道十足,并且似乎还有自己独到的见解。

【suno ai】春天在哪里,但是ai版_哔哩哔哩_bilibili

除了音乐创作之外,语音合成和声音设计等等,也是AIGC技术在音频方面不可忽视的应用。

3) 图像生成

将草图转换为数字绘制的图像,其实本质上起到修饰的作用,但是延伸出了包括视觉艺术、广告设计、游戏场景等等方面的创作协助,这无疑给众多行业带来一个巨大的Pandora’s box,毕竟还有那么多的美术创作者,或许还在为如何塑造好的线条美感而烦恼,而如今AIGC已经较好地解决了这个问题。

4) 视频生成

人工智能生成的视频同样不能忽视,虽然目前仅仅支持无声视频,这实际上并不等同于完整的视频;如今市面上出现的许多由AI独立生成的具有指定风格的视频,让人难以辨认其真假(指是否为人创作);而事实上,这个问题在整个AIGC的应用中都频频出现,这是难以避免的。

5) 跨模式生成

AIGC中的跨模态内容生成是指使用基础AIGC模型跨多种模态生成新内容。它包括文本到图像、图像到文本、文本到代码、文本到视频、文本到音频等。像ChatGPT提供的语音对话助手,它基于文本创作,再结合了人类说话的特点,可以模仿人类的口吻完成对话,甚至连话语之间的吸气声也不会漏掉,这就是文本到音频的跨模式生成的典型例子。

6)虚拟人的诞生

AIGC可以生成具有逼真表情或者动作的虚拟人,而这实际上是集合了上述几乎所有应用综合生成的一大产物,可以想象《银翼杀手2049》中的场景离自己如此之近(相对从前)。

2.其他应用

基于内容创作,衍生出的其他应用实际上可以认为是覆盖到人类生活的各个方面。在医疗方面,通过大数据广泛吸纳各个方面的医学知识,医生可以仅仅通过一句提问就得到专业性的回答,对症下药,当然这只是最浅显的应用。像病情分析,患者医疗方案制定等,更是有分化的不同使用,例如:利用生成式人工智能(AIGC)解决『医疗领域』的痛点和难题 - 知乎 (zhihu.com),这篇文章很好地展示了临床医生和患者之间互动记录的全过程,解决了原本需要消费巨大人工成本的难题以及记录的准确性和完整性。在营销推广方面,广告版面的设计,广告语的修饰,针对用户群体生成个性化的营销方案,博人眼球、吸引用户,颇有成效。
在这里插入图片描述

在教育和服务业方面,AI的赋能可以帮助教师和服务业人员优化他们的教案和服务制定方案,同时像一众的AI软件也是服务业面向AI创作的产物,毕竟,AIGC本身就是为了更好地服务于人,优化人的工作的技术。值得一提的是,随着网购行业和直播流的发展,客服实际上是一个十分重要且需要精确度的岗位,而AI恰好能够较好地解决大部分繁琐、常见、无需人工的问题,这也给服务业带来了巨大的发展。

这仅仅只是AIGC应用的冰山一角,实际上我们人类目前对于AI的探索也仅仅只是管中窥豹,毕竟AI的处理中枢就是由各种数据和算法构成的一个近似人类大脑的集成系统,而我们甚至对自己的大脑都没有彻底探索清楚,那么对于AI的开发之路也就道阻且长了。

AIGC的舆论危机

其实不难看出,AI技术的发展一直都在遭受着舆论的危机,而这也将是决定其发展方向的一重要因素——这是不可避免的。既然我们创造了它,那么我们也可以操控它。这或许是我们创造这门技术的理想方向,也是我们需要努力在其飞速发展的过程中渴望一直秉持的操作。

知识产权的侵犯,无休止的侵权风波

由于AI基于大数据的收集,那么必然避不开任何数据的使用和借鉴,这也就必然会涉及到知识产权的侵犯问题——然而这个界限是模糊的,是无法模棱两可的。你可以说是因为这种行为目前已经泛滥成脏无可休止,也可以说产权持有者对于这种行为的处理的乏力和漠不关心——你甚至可以说这还是一种宣传知识的行为。这种不清晰的界限导致这个问题难以得到清晰的解答。

虚假内容的传播,犯罪的幕后黑手

AI或许不会真正意义的说谎,但人类可以告诉它虚假的事实,而它恰好可以编造更为逼真的事实。大范围的虚假内容传播会导致事实不再那么透明,真相被不明掩盖。更何况它有可能带来犯罪。我国实际上已经有了相关的法律规定:《互联网信息服务深度合成管理规定》、《生成式人工智能服务管理暂行办法》等等,人民法院官方甚至也发表了对有关人工智能法律问题的思考。这些现象无不表明政府正在逐渐重视针对AI的法律体系完善和改进,而这也将成为今后限制AIGC技术发展的一大决定性因素(同时也是必不可少的)。

在这里插入图片描述

隐私问题:数据的收集

我们知道,AIGC技术的可行性在于海量数据的提供,那么它势必会涉及到个人数据的隐私问题。由于人工智能本身对数据的索取之深,再加上人们对大数据决策产生深度依赖,对于自身的数据的丢失的概念不够清晰,那么隐私问题必然是层出不穷的,这实际上是不可避免的,当然你可以认为只要不危害自己的生活,数据的泄露和滥用也就对自己影响不大,虽然话可以这么说,毕竟AI所做的只是数据的收集,而至于对于数据的使用,可能就需要法律来规范了。无论如何,我们还是要尽量保护自己的隐私权不受侵犯,尽量保护自己的基本权利。

道德危机,人类与AI的博弈

这是最为老生常谈的一个问题。人类总是在以高昂的姿态前进,在此之前从未有过超越人类本身的、人类自己创造的产物出现,而如今AI的出现,恰似棋逢对手,虽然是“我诞生了你”,但是“你未必就劣于我”。必然会造成很大的舆论危机和伦理问题的讨论。人类和技术之间实际上是一种共生关系。这是凯文凯利的观点。人类创造了人工智能,但也要学会与其和平共处,它在各方面的渗透之深也表明了——如果不与其保持良好的和谐关系,将会造成的问题是谁也不敢设想的。我们生活在一个高速发展的社会,但同样道德和伦理也限制着我们发展的速度和方向,但AI或许在某些方面的准则与我们人类并不一致,这也就间接导致了我们在与其共生的过程中所要注意的问题和界限。或许我们可以通过技术来告诉AI应该怎么做,应该遵循什么原则,但是要形成一套完整的、不出差错的体系是非常之难的——毕竟我们人类自己都没有形成一套完全相同的道德体系和认知观念。所以,我相信关于这些问题的争论会一直持续,我们只有不断试错和改进,才能朝着完美的方向前进,至于能否达到,一切未知。

AI的未来

如今我们再看文章开头的那个问题:那么针对AIGC对于人类社会的浸入,我们究竟该如何看待呢?

实际上仅凭我一家之言是根本无法回答的,甚至可以夸张地说,没有经历时间的检验,这个问题谁也无法给出准确的答案。毕竟,未来还未来临。所以,既然这门技术已经出现了,我们无法避免不跟随社会不断前进的脚步,否则会脱轨;我们也无法不陷于这个满是AI的世界,毕竟新的时代已经到来,就跟二十年前的互联网时代一般,那个时候人们同样有着针对互联网的疑问:将世界仅通过那么细的网线连接,如此神奇之技术究竟会给人类社会带来什么?

其实,我们现在也只能发出同当年一样的疑问:

现了,我们无法避免不跟随社会不断前进的脚步,否则会脱轨;我们也无法不陷于这个满是AI的世界,毕竟新的时代已经到来,就跟二十年前的互联网时代一般,那个时候人们同样有着针对互联网的疑问:将世界仅通过那么细的网线连接,如此神奇之技术究竟会给人类社会带来什么?

其实,我们现在也只能发出同当年一样的疑问:

AIGC如此神奇之技术究竟会给人类社会带来怎样的发展和变革呢?让我们拭目以待。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/599703.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

快速排序找出第K大的元素

有序数组里第 K 大的元素就是index 为 array.length - k 的元素。 快速排序的思路主要就是选一个基准值p,然后将小于p的值放在p的左右,大于p的值放在p的右边,然后对左右数组进行递归。 利用这个思路,当我们找到这个基准值对应的 i…

【教学类-50-14】20240505“数一数”图片样式12:数一数(12个“人物”图案)

作品展示 背景需求: 前文做了“”材料”图片的数一数学具,效果不错, https://blog.csdn.net/reasonsummer/article/details/138466325https://blog.csdn.net/reasonsummer/article/details/138466325 为了让图案内容更丰富,我又…

Python Dash库:一个Web应用只需几行代码

大家好,在数据科学领域,数据可视化是将数据以图形化形式展示出来,帮助我们更直观地理解数据。Python中有一个非常流行的数据可视化库叫做Dash,Dash以其简洁、高效和强大的功能而闻名,它允许开发者快速构建交互式Web应用…

【智能算法】人类进化优化算法(HEOA)原理及实现

目录 1.背景2.算法原理2.1算法思想2.2算法过程 3.结果展示4.参考文献5.代码获取 1.背景 2024年,J Lian受到人类进化启发,提出了人类进化优化算法(Human Evolutionary Optimization Algorithm, HEOA)。 2.算法原理 2.1算法思想 …

JavaWEB 框架安全:Spring 漏洞序列.(CVE-2022-22965)

什么叫 Spring 框架. Spring 框架是一个用于构建企业级应用程序的开源框架。它提供了一种全面的编程和配置模型,可以简化应用程序的开发过程。Spring 框架的核心特性包括依赖注入(Dependency Injection)、面向切面编程(Aspect-Or…

Springboot项目学习之各组件的用法和逻辑结构

1.Controller层(Controller): 也称为前端控制器或请求处理器,它是项目与用户交互的入口。Controller接收HTTP请求,解析请求参数,调用Service层处理业务逻辑,并返回响应给客户端。 Controller通…

IP证书能免费申请吗

IP SSL证书是一种数字证书,用于保护网络服务器和网络浏览器之间的通信。该证书是一种主要保护公网IP地址的专属信任SSL证书。 IP类型的SSL证书对于直接用IP地址传输数据的技术人员来说,十分重要!无论是防洪还是防劫持还是数据加密都起到了关…

【C 数据结构-动态内存管理】4. 无用单元收集(垃圾回收机制)

文章目录 【 1. 问题描述与解决方法 】【 2. 中断回收机制 】 【 1. 问题描述与解决方法 】 问题描述 动态存储管理的运行机制可以概括为:当用户发出申请空间的请求后,系统向用户分配内存;用户运行结束释放存储空间后,系统回收内…

【FL常用插件#1】Ozone11臭氧的安装和使用

本文内容收集自互联网,仅供个人学习参考使用,不允许用于商业用途,造成的侵权行为与本文作者无关 安装 VST2、VST3、AAX和NKS是音频技术界常见的几种插件格式,它们在功能和兼容性上有所不同: VST2 (Virtual Studio Tec…

用户管理中心——数据库设计用户注册逻辑设计

用户管理中心——数据库设计&用户注册逻辑设计 规整项目目录1. 数据库自动生成器的使用实现基本的数据库操作(操作user表) 2. 注册逻辑的设计(1) 写注册逻辑(2) 实现(3) 测试代码 3. 遇到的问题 规整项目目录 utils–存放工具类,比如加密…

关系型数据库MySQL开发要点之多表设计案例详解代码实现

什么是多表设计 项目开发中 在进行数据库表结构设计时 根据数据模型和业务关系 会根据业务需求和业务模块之间的关系分析设计表结构 由于业务之间互相关联 所以表结构之间也存在着各种联系 主要分为以下三种 一对多 每个部门下是有多个员工的 但是一个员工只能归属一个部…

京东JD商品详情API返回值揭秘:精准掌握商品信息

在当今电子商务繁荣的时代,对于电商平台来说,提供准确、详尽的商品信息对于满足用户需求、提升购物体验至关重要。京东作为中国领先的电商平台,通过其开放的API接口,为开发者提供了获取商品详情的强大工具。本文将深入探讨京东JD商…

FastDFS-单机扩容

描述 周一上班收到用户反馈系统异常,紧急排查日志发现报错:FdfsServerException:错误:28,错误信息:没有足够的存储空间。 解决 根据异常信息判断是文件服务器可用内存不够了,首先登录文件服务器,使用df -h命令查看一…

GMS地下水数值模拟及溶质(包含反应性溶质)运移模拟技术

采用全流程模式将地下水数值模拟软件GMS的操作进行详细剖析和案例联系。不仅使学员掌握地下水数值模拟软件GMS的全过程实际操作技术的基本技能,而且可以深刻理解模拟过程中的关键环节,以解决实际问题能力。同时为满足环评从业人员进一步加强地下水数值模…

AF594-标记羊抗鼠免疫球蛋白(H+L),山羊抗小鼠IgG全长抗体已被交叉吸附在抗人IgG和人血清上,然后再偶联以小化交叉反应性

试剂介绍: AF594-标记羊抗鼠免疫球蛋白(HL)是荧光标记二抗,我们的山羊抗小鼠IgG全长抗体已被交叉吸附在抗人IgG和人血清上,然后再偶联以小化交叉反应性。 这种AF594标记的山羊抗小鼠IgG缀合物通过交叉吸附的山羊抗小鼠IgG全抗体与AF594 NHS酯…

应用层协议——HTTP协议

1. 认识HTTP协议 HTTP(Hyper Text Transfer Protocol)协议又叫做超文本传输协议,是一个简单的请求-响应协议,HTTP通常运行在TCP之上。 超文本的意思就是超越普通的文本,http允许传送文字,图片&#xff0c…

深入理解nginx http响应限速功能

目录 1. 引言2. 配置参数2.1 limit_rate 配置指令2.2 limit_rate_after 配置指令2.3 其他限速配置 3. 源码分析 1. 引言 在现代互联网应用中,服务器的性能和响应速度是至关重要的。为了保证服务器的稳定性和可靠性,限制客户端对服务器的访问速度是一项重…

Web实操(6),基础知识学习(24~)

1.[ZJCTF 2019]NiZhuanSiWei1 (1)进入环境后看到一篇php代码,开始我简单的以为是一题常规的php伪协议,多次试错后发现它并没有那么简单,它包含了基础的文件包含,伪协议还有反序列化 (2&#x…

【数据结构】顺序表与ArrayList

一、什么是顺序表 概念:顺序表是用一段物理地址连续的存储单元依次存储数据元素的线性结构,一般情况下采用数组存储。在数组上完成数据的增删查改。 如下图: 优点:访问速度比较快,在给定下标的情况下时间复杂度低至O(…

网络1--通信过程的理解

1.封装与解包 通信的过程就是不断的封装和解包的过程 封装即就是按照“应用”“传输” “网络” “链路” 层,封装给每一层都加上相应的包头(每一层都有协议,)解包就是接受到的包文被一层层去掉相对应的包头。 任何一层的协议都…
最新文章