新规拉开中国生成式AI“百团大战”序幕?

AI将走向何方?

ChatGPT在全球范围掀起的AI热潮正在引发越来越多的讨论,AI该如何管理?AI该如何发展?一系列问题都成为人们热议的焦点。此前,马斯克等海外名人就在网络上呼吁OpenAI暂停ChatGPT的模型训练和迭代,等待企业与政府讨论出一套行之有效的管理方法后再继续。 

显然,此举遭到了OpenAI的反对,不过OpenAI也认可马斯克的部分说法:“AI确实需要管控”,在一次访谈中,OpenAI的创始人之一更是直言自己有时候会对ChatGPT感到恐惧,AI确实有可能对人类造成威胁。 

当我们惊叹于ChatGPT的强大时,确实不该忘记AI技术发展所带来的“可能威胁”。4月11日,国家互联网信息办公室发布了关于《生成式人工智能服务管理办法(征求意见稿)》的公开征求意见通知,国内有关生成式人工智能的第一个管理条例来了。 

以下为《生成式人工智能服务管理办法(征求意见稿)》的原文。

第一条 为促进生成式人工智能健康发展和规范应用,根据《中华人民共和国网络安全法》《中华人民共和国数据安全法》《中华人民共和国个人信息保护法》等法律、行政法规,制定本办法。 

第二条 研发、利用生成式人工智能产品,面向中华人民共和国境内公众提供服务的,适用本办法。本办法所称生成式人工智能,是指基于算法、模型、规则生成文本、图片、声音、视频、代码等内容的技术。

第三条 国家支持人工智能算法、框架等基础技术的自主创新、推广应用、国际合作,鼓励优先采用安全可信的软件、工具、计算和数据资源。 

第四条 提供生成式人工智能产品或服务应当遵守法律法规的要求,尊重社会公德、公序良俗,符合以下要求:(一)利用生成式人工智能生成的内容应当体现社会主义核心价值观,不得含有颠覆国家政权、推翻社会主义制度,煽动分裂国家、破坏国家统一,宣扬恐怖主义、极端主义,宣扬民族仇恨、民族歧视,暴力、淫秽色情信息,虚假信息,以及可能扰乱经济秩序和社会秩序的内容。(二)在算法设计、训练数据选择、模型生成和优化、提供服务等过程中,采取措施防止出现种族、民族、信仰、国别、地域、性别、年龄、职业等歧视。(三)尊重知识产权、商业道德,不得利用算法、数据、平台等优势实施不公平竞争。(四)利用生成式人工智能生成的内容应当真实准确,采取措施防止生成虚假信息。(五)尊重他人合法利益,防止伤害他人身心健康,损害肖像权、名誉权和个人隐私,侵犯知识产权。禁止非法获取、披露、利用个人信息和隐私、商业秘密。 

第五条 利用生成式人工智能产品提供聊天和文本、图像、声音生成等服务的组织和个人(以下称“提供者”),包括通过提供可编程接口等方式支持他人自行生成文本、图像、声音等,承担该产品生成内容生产者的责任;涉及个人信息的,承担个人信息处理者的法定责任,履行个人信息保护义务。 

第六条 利用生成式人工智能产品向公众提供服务前,应当按照《具有舆论属性或社会动员能力的互联网信息服务安全评估规定》向国家网信部门申报安全评估,并按照《互联网信息服务算法推荐管理规定》履行算法备案和变更、注销备案手续。 

第七条 提供者应当对生成式人工智能产品的预训练数据、优化训练数据来源的合法性负责。用于生成式人工智能产品的预训练、优化训练数据,应满足以下要求:(一)符合《中华人民共和国网络安全法》等法律法规的要求;(二)不含有侵犯知识产权的内容;(三)数据包含个人信息的,应当征得个人信息主体同意或者符合法律、行政法规规定的其他情形;(四)能够保证数据的真实性、准确性、客观性、多样性;(五)国家网信部门关于生成式人工智能服务的其他监管要求。 

第八条 生成式人工智能产品研制中采用人工标注时,提供者应当制定符合本办法要求,清晰、具体、可操作的标注规则,对标注人员进行必要培训,抽样核验标注内容的正确性。 

第九条 提供生成式人工智能服务应当按照《中华人民共和国网络安全法》规定,要求用户提供真实身份信息。 

第十条 提供者应当明确并公开其服务的适用人群、场合、用途,采取适当措施防范用户过分依赖或沉迷生成内容。 

第十一条 提供者在提供服务过程中,对用户的输入信息和使用记录承担保护义务。不得非法留存能够推断出用户身份的输入信息,不得根据用户输入信息和使用情况进行画像,不得向他人提供用户输入信息。法律法规另有规定的,从其规定。 

第十二条 提供者不得根据用户的种族、国别、性别等进行带有歧视性的内容生成。 

第十三条 提供者应当建立用户投诉接收处理机制,及时处置个人关于更正、删除、屏蔽其个人信息的请求;发现、知悉生成的文本、图片、声音、视频等侵害他人肖像权、名誉权、个人隐私、商业秘密,或者不符合本办法要求时,应当采取措施,停止生成,防止危害持续。 

第十四条 提供者应当在生命周期内,提供安全、稳健、持续的服务,保障用户正常使用。 

第十五条 对于运行中发现、用户举报的不符合本办法要求的生成内容,除采取内容过滤等措施外,应在3个月内通过模型优化训练等方式防止再次生成。 

第十六条 提供者应当按照《互联网信息服务深度合成管理规定》对生成的图片、视频等内容进行标识。 

第十七条 提供者应当根据国家网信部门和有关主管部门的要求,提供可以影响用户信任、选择的必要信息,包括预训练和优化训练数据的来源、规模、类型、质量等描述,人工标注规则,人工标注数据的规模和类型,基础算法和技术体系等。 

第十八条 提供者应当指导用户科学认识和理性使用生成式人工智能生成的内容,不利用生成内容损害他人形象、名誉以及其他合法权益,不进行商业炒作、不正当营销。用户发现生成内容不符合本办法要求时,有权向网信部门或者有关主管部门举报。 

第十九条 提供者发现用户利用生成式人工智能产品过程中违反法律法规,违背商业道德、社会公德行为时,包括从事网络炒作、恶意发帖跟评、制造垃圾邮件、编写恶意软件,实施不正当的商业营销等,应当暂停或者终止服务。 

第二十条 提供者违反本办法规定的,由网信部门和有关主管部门按照《中华人民共和国网络安全法》《中华人民共和国数据安全法》《中华人民共和国个人信息保护法》等法律、行政法规的规定予以处罚。法律、行政法规没有规定的,由网信部门和有关主管部门依据职责给予警告、通报批评,责令限期改正;拒不改正或者情节严重的,责令暂停或者终止其利用生成式人工智能提供服务,并处一万元以上十万元以下罚款。构成违反治安管理行为的,依法给予治安管理处罚;构成犯罪的,依法追究刑事责任。 

第二十一条 本办法自2023年 月 日起实施。

从内容来看,目前还只是一个初步的管理条例,对应的处罚及法律依据来自此前发布的《中华人民共和国网络安全法》《中华人民共和国数据安全法》《中华人民共和国个人信息保护法》等法律、行政法规。 

看到管理条例的发布,不少网友都持肯定态度,AI的发展速度之迅猛超出了许多人的预料,并且已经开始对社会造成明显的影响,确实需要对AI的发展与使用做出管理,避免对社会造成严重的危害。 

不过也有网友认为,这份“管理办法”的一些条例,或许会让中国企业在AI赛道的竞争力减弱,因为其中的一些要求对于目前的AI模型来说,是很难确保100%符合规定的,势必让企业在开发过程中畏手畏脚。 

现如今的AI,是否已经到了必须管控的地步呢?

 “撒谎”的AI 

在前段时间,我先后体验和测试百度的文心一言与阿里巴巴的通义千问,作为国内首批开展内测的对话式AI大模型,两者在体验上虽然不如ChatGPT 4.0,不过也已经具备一定的能力,从测试结果来看也是各有千秋。 

但是,不管是文心一言还是通义千问,都无法避免在一些回答中“撒谎”,或者换个说法,现阶段的AI模型基本上避免不了根据已有信息生成虚构内容的问题,即使是ChatGPT 4.0也是如此。

甚至从测试来看,ChatGPT的虚构信息能力要远超文心一言等较低等级的AI对话模型,有兴趣的朋友可以在知乎、B站等平台搜索相关内容,可以轻松查询到不少ChatGPT一本正经地胡说八道的记录。 

在知乎上,用户@何学源 就展示了ChatGPT是如何从0开始编造自己的人生经历的,只需要给ChatGPT一定的关键词,AI就会依据关键词进行信息编造,将一些完全杜撰或是不属于本人成就的信息拼接到一起,生成一份回答。

从提供的ChatGPT对话截图来看,AI不仅是生成了一系列编造的个人信息,在用户要求提供相关的引用论文和文章时,AI更是直接生成了一系列不存在的网络链接与论文标题,给用户@何学源 带来一些小小的AI震撼。

在我的测试中,文心一言也有类似的问题,比如我在询问它:“吃西瓜为什么不吐葡萄皮”时,文心一言不仅将西瓜与葡萄的关系混淆,甚至将归属于葫芦科的西瓜变成了“葡萄科”的,接下来的内容都基于西瓜与葡萄是同一样水果的逻辑进行解答,以至于错漏百出。 

只是相对于ChatGPT能够以假乱真的“撒谎”行为来看,具有一定知识储备的人可以轻松辨认出文心一言回答中的问题。但是,如果未来的文心一言经过迭代进步后达到ChatGPT的同等水平,人们又该如何分辨其中的问题? 

再进一步,如果有人不怀好意地让AI故意生成“谣言”,又该如何解决?实际上,互联网上已经出现了不少利用AI生成的图片、文字来进行诈骗、造谣的案例,前段时间就有人利用AI生成的模特图片进行网络诈骗,甚至还成功骗到了不少人。

在我看来,对于AI的管控确实应该提上日程,不仅仅是国内在紧锣密鼓地筹备相关法例法规,美国也将在近期召集微软、谷歌、OpenAI等一系列相关企业,探讨对AI的约束与规定,使其在使用和发展的过程中不会侵犯用户的合法权益。 

正是出于对AI的“撒谎”能力担忧,《生成式人工智能服务管理办法(征求意见稿)》中就明确写明了“利用生成式人工智能生成的内容应当真实准确,采取措施防止生成虚假信息。”,同时也使该条例引起了许多网友的争议。

但就目前的AI能力来说,想要满足“真实准确”的难度非常高,前面提到过ChatGPT都无法做到,国内的AI则更是如此。严格来说,甚至连人类自己其实也无法做到所有的回答、信息都真实准确,我们的记忆会出错,对知识点、新闻的理解会出错,而且网络上本就充斥着大量的虚假信息,以网络数据训练出来的AI显然不可避免地受其影响。 

有网友甚至直言:“如果哪一天AI能够完美规避错误答案,生成100%准确且真实的回答,那么人类就该担心自己了”,言下之意就是这种程度的AI已经不再是普通的工具,而是具备独立思维且拥有强大能力的“超级生命”。 

当然,目前的AI离我们设想中的“完美AI”还有着非常遥远的距离,但是对于AI“谎言”的管控确实该提上日程了。不过,一些网友则认为不应该对AI的回答准确率过早地做出严苛规定,否则以目前的错误率来看,国内的所有AI模型都可以停止对外运营。

实际上,这些网友的发言多少有点危言耸听,对于阿里、百度等企业来说,处理错误答案与内容一直都是AI模型迭代中的重要工作,文心一言和通义千问在问答框中都有设置一键反馈按钮,可以轻松对错误回答进行标记,帮助完善AI模型。 

而且,从条例的细则来看,对企业的要求是在3个月采取措施修正生成错误回答的AI模型,确保同样的错误不会再次发生,实际上也是给了企业不少的处理时间。对于阿里和百度来说,如果3个月都无法处理一个明显的错误,那么或许该考虑一下是不是有工程师在“摸鱼”了。

入局AI市场的门槛将更高 

从条例本身来看,不少要求与规范其实都是AI企业已经在做的事情,比如对错误答案进行优化、限制非法内容的输出等。在文心一言和通义千问上,对于违规或非法的问题基本上都只会得到一个类似的回复:“我是一个人工智能语言模型,无法对xxxx进行评价。我的目的是提供客观和准确的信息,帮助人们解决问题”。 

ChatGPT同样如此,如果你使用的是通过官网API接口提供的服务及NEWBING,那么在涉及暴力、血腥、色情等方面的提问时,AI都会直接结束当前话题并提示用户应该更换一个话题。 

对于AI的规制其实一直都存着,公开的AI平台本就不是法外之地,不少企业也在探讨对AI模型进行修改,使其生成的图片、视频、音频会自动附加可用于快速识别的标记,用以在网络上对相关的AI生成内容进行快速标识。

图源:网络 

在我看来,对AI行业最大的影响是切实地提高了入门门槛,随着ChatGPT的大火,国内开始涌现出大量的AI企业和项目,除了阿里、百度、华为等科技巨头外,还有不少的小企业和个人也在宣传自己的项目,使得国内的AI市场变得十分混乱。 

此次条例实施后,对于AI企业的规模、反馈处理等能力都提出了更高的要求,对于目前的大厂来说,满足以上要求并不困难,倒不如说已经在做了。实际上,更大的难点在于训练数据的获取,目前的AI模型基本都是通过爬虫等手段,大量抓取网络信息进行训练迭代。 

由此引发了不少网友的指责,认为AI企业在训练中使用了未经过授权的用户个人数据,侵犯了个人隐私,意大利政府此前就公开要求ChatGPT完善数据爬取方式,以确保不会擅自使用未经授权的数据。 

此外,三星此前也发布公告,要求严格管控企业内部的ChatGPT使用情况,避免企业机密外泄,因为ChatGPT将三星部分员工输入的机密数据作为训练数据,上传到了ChatGPT的数据库中,导致其他用户可以通过问答的方式获取这些数据,直接影响到三星的企业安全。 

为了确保公民信息及个人数据的安全,未来AI企业在隐私保护等方面需要花费更多的成本来完善相关的保障系统。而且,对训练数据的严格规范也会直接影响到AI企业的训练成本,此前华为就声称,开发和训练一个AI的成本高达1200万元美元,而且还不包括后续的硬件、数据投入。 

随着相关管理的规范化,AI训练的成本或许会将多数中小企业拒之门外,对于个人和中小企业来说,使用阿里等开放式AI训练平台将会是未来的主流。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/9442.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

算法套路八——二叉树深度优先遍历(前、中、后序遍历)

算法套路八——二叉树深度优先遍历(前、中、后序遍历) 算法示例:LeetCode98:验证二叉搜索树 给你一个二叉树的根节点 root ,判断其是否是一个有效的二叉搜索树。 有效 二叉搜索树定义如下: 节点的左子树只…

Shell脚本之免交互

一、Here Document免交互 1、 概念 Here Document使用I/O重定向的方式将命令列表提供给交互式程序或命令,比如 ftp、cat 或 read 命令。 是标准输入的一种替代品可以帮助脚本开发人员不必使用临时文件来构建输入信息,而是直接就地生产出一个"文件…

No.033<软考>《(高项)备考大全》【第17章】战略管理

【第17章】战略管理1 章节相关2 战略管理2.1 组织战略管理2.1 组织战略类型和层次2.1.1 组织事业战略类型2.1.2 组织事业战略类型2.1.3 组织完整的战略包括三个层次2.1.4 组织战略从层次分为组织层战略、事业层战略、职能层战略等2.1.5 平横计分卡2.1.6 项目组合管理3 练习题参…

Leetcode.111 二叉树的最小深度

题目链接 Leetcode.111 二叉树的最小深度 easy 题目描述 给定一个二叉树,找出其最小深度。 最小深度是从 根节点 到 最近叶子节点 的 最短路径上的节点数量。 说明: 叶子节点是指没有子节点的节点。 示例 1: 输入:root [3,9,20,null,nul…

车载网络 - Autosar网络管理 - 网络管理简介

一、什么是CAN网络管理及它的作用 现在的车辆是由大量的ECU节点组成的,为了能使各ECU能够正确并及时地进行CAN通信,需要有一套机制来统一协调总线上各节点的休眠唤醒,这套机制就是CAN网络管理(NM)。 网络管理的目的是保…

项目2:后端管理员项目结构初始化

项目2:后端管理员项目结构初始化 1.创建数据库和表 2.初始化父项目 3.初始化项目模块 4.初始化core核心模块(代码生成器) 项目2:后端管理员项目结构初始化 1.创建表 创建数据库 编码使用utf-8 sql语句 /*Navicat Premium …

18_I.MX6ULL_I2C实验

目录 I2C简介 起始位 停止位 数据传输 应答信号 I2C写时序 I2C读时序 I2C多字节读写时序 相关寄存器 AP3216C简介 实验源码 I2C简介 I2C是最常用的通信接口,众多的传感器都会提供I2C接口来和主控相连,比如陀螺仪、加速度计、触摸屏等等。所以I2C是做嵌入式开发必须…

【高项】项目人力资源管理,沟通管理与干系人管理(十大管理)

【高项】项目人力资源管理,沟通管理与干系人管理(十大管理) 文章目录1、人力资源管理1.1 什么是人力资源管理?1.2 如何进行人力资源管理?(过程)1.3 人力资源管理工具1.4 人力资源管理文件2、沟通…

语雀笔记备份导出

参考: https://www.cnblogs.com/ssslinppp/p/17020303.htmlhttps://github.com/yuque/yuque-exporterhttps://zhuanlan.zhihu.com/p/582287220https://www.yuque.com/duzh929/blog/ocffqghttps://www.yuque.com/hijiaobu/datalife/onf6sy#BKajf 现在需要超级管理员,若是没有超级…

【华为机试真题详解JAVA实现】—整数与IP地址间的转换

目录 一、题目描述 二、解题代码 一、题目描述 原理:ip地址的每段可以看成是一个0-255的整数,把每段拆分成一个二进制形式组合起来,然后把这个二进制数转变成 一个长整数。 举例:一个ip地址为10.0.3.193 每段数字 相对应的二进制数 10 000…

GDPU C语言 天码行空6

1. 数组顺序查找 ⭐ 语法题 #include<stdio.h>int main() {int n,x,i;int a[102];scanf("%d", &n);for (i 0; i < n; i){scanf("%d", &a[i]);}scanf("%d", &x);int idx -1;//记录x的最大下标int max 0;// 记录大于x的数…

如何写一个优质高效的网络项目实施方案?这篇文章值得收藏!

随着互联网技术的不断发展&#xff0c;网络项目的实施成为了许多企业和组织的重要任务。网络项目实施方案是指在进行网络项目实施时&#xff0c;为了保障项目的顺利进行&#xff0c;达到项目目标和交付要求&#xff0c;所制定的详细计划和操作指南。一个好的网络项目实施方案对…

Unity Game FrameWork—模块使用—对象池分析

官方说明&#xff1a;提供对象缓存池的功能&#xff0c;避免频繁地创建和销毁各种游戏对象&#xff0c;提高游戏性能。除了 Game Framework 自身使用了对象池&#xff0c;用户还可以很方便地创建和管理自己的对象池。 下图是Demo中用到的对象池&#xff0c;所有的实体以及UI都使…

C++11多线程:原子操作std::automic-用于多个线程之间共享的变量。

系列文章目录 文章目录系列文章目录前言一、std::automic二、使用步骤1.代码案例总结前言 原子操作std::automic的基本概念和用法。 一、std::automic std::atomic来代表原子操作&#xff0c;std::automic是个类模板。其实std::atomic这个东西是用来封装某个类型的值的。 1.1…

echarts tooltip文字太长换行

tooltip文字太长换行&#xff0c;设置了宽度也没有换行&#xff0c;加上一句&#xff1a; extraCssText: ‘max-width:300px; white-space:pre-wrap’, 没加之前是这样&#xff1a; 加上之后 extraCssText: ‘max-width:300px; white-space:pre-wrap’, tooltip: {trigger: &…

Mybatis(六)缓存

缓存是Mybatis中非常重要的特性&#xff0c;Mybatis的一级缓存基于SqlSession实现&#xff0c;二级缓存基于Mapper实现。 一、缓存的使用 一级缓存默认开启&#xff0c;Mybatis提供了一个配置参数localCacheScope来控制一级缓存的级别&#xff0c;该参数的取值可以是session、…

主动配电网故障恢复的重构与孤岛划分统一模型研究【升级版本】(Matlab代码实现)

&#x1f4a5;&#x1f4a5;&#x1f49e;&#x1f49e;欢迎来到本博客❤️❤️&#x1f4a5;&#x1f4a5; &#x1f3c6;博主优势&#xff1a;&#x1f31e;&#x1f31e;&#x1f31e;博客内容尽量做到思维缜密&#xff0c;逻辑清晰&#xff0c;为了方便读者。 ⛳️座右铭&a…

CesiumForUnreal实现多边形裁剪3dTileset效果

文章目录 1.实现目标2.实现过程3.原理浅析4.参考资料1.实现目标 基于CesiumForUnreal插件的Cartographic Polygon Actor在Runtime运行时环境下实现对地形3DTileset的多边形裁剪效果,GIF动图如下: 2.实现过程 在Editor中的具体操作过程可以参考CesiumForUnreal官方裁剪地形的…

小巧型温湿度传感器

小巧型温湿度传感器是一种小巧的温湿度传感器&#xff0c;其作用是测量周围环境的温度和湿度&#xff0c;以及确定这些数据是否处于合适的范围内。这种传感器已经被广泛应用于医疗、工业、家居、冷链运输等领域&#xff0c;成为现代工业中不可或缺的一部分。小巧型温湿度传感器…

前置知识——Linux网络虚拟化

Linux网络虚拟化 信息是如何通过网络传输被另一个程序接收到的&#xff1f; 我们讨论的虚拟化网络是狭义的&#xff0c;它指容器间网络。 好了&#xff0c;下面我们就从 Linux 下网络通信的协议栈模型&#xff0c;以及程序如何干涉在协议栈中流动的信息来开始了解吧。 Linux…