AI时代带来的图片造假危机,该如何解决

一、前言

当今,图片造假问题非常泛滥,已经成为现代社会中一个严峻的问题。随着AI技术不断的发展,人们可以轻松地通过图像编辑和AI智能生成来篡改和伪造图片,使其看起来真实而难以辨别,之前就看到过一对硕士夫妻为了骗保竟篡改结婚证、离婚证等信息:

甚至诺贝尔奖获奖者发表的论文中也疑似进行了图像篡改的行为:

这给社会带来了许多负面影响,尤其是在保险、金融、银行等领域,如果将虚假篡改过的信息资料审核通过更是会带来巨大的影响甚至是经济上的损失。

而且在当今AI快速发展的背景下,图像篡改的技术门槛越来越低,效果也越来越逼真。

所以,研究和开发图像篡改和伪造检测技术变得至关重要,推出一种能高效准确的检测出图像造假的方法或工具是迫在眉睫的!

刚好在最近的WAIC2023大会上,合合信息在图像篡改检测、AI图像安全领域上分享了他们的三种策略:图像篡改检测、AIGC判别、OCR对抗攻击技术:

让我们来看看他们是如何解决这些问题的。

二、会议分享

1)图像篡改检测

早在去年的世界人工智能大会上,合合信息”PS篡改检测”技术首次亮相,“像素级”起底修改痕迹,覆盖身份证、护照等多种证照识别类目,吸引了社会各界关注。我也使用过他们提供的PS检测服务来检测身份证伪造的情况,效果也是非常不错的,能够准确的识别出被篡改的部分:

今年合合信息团队对图像篡改检测“黑科技”持续优化升级,应用面也拓展至“截图篡改检测”,此前,图像篡改检测的技术研究对象主要集中于自然场景图像,然而,真正为人们的生活带来风险的通常是被篡改的资质证书、文档、截图等。现在合合信息的AI篡改检测技术还能够对包括转账记录、交易记录、聊天记录等多种截图,无论是从原图中“抠下”关键要素后移动“粘贴”至另一处的“复制移动”图片篡改手段,还是“擦除”、“重打印”等方式,图像篡改检测技术均可“慧眼”识假:

截图防伪检测对于证照检测来讲是更困难的,因为截图的背景没有纹路和底色,整个截图没有光照差异。证件篡改识别尚可通过拍照时产生的成像差异进行篡改痕迹判断,而截图则没有这些“信息”。现有的视觉模型通常难以充分发掘原始图像和篡改图像的细粒度差异特征,因此难以实现令人满意的准确率。为此,合合信息提出了一种基于HRNet的编码器-解码器结构的图像真实性鉴别模型,结合图像本身的信息包括但不限于噪声、频谱等, 从而捕捉到细粒度的视觉差异,达到高精度鉴别目的:

2)生成式图像鉴别

除此之外,合合信息在生成式图像鉴别方面也有所建树

在去年底的时候,我就体验过AIGC的强大,给予AI一段描述,短短几十秒就能生成出与之匹配的画作出来,下图为我使用某平台的AIGC产品生成的画作(描述文字内容为:森林里的蘑菇房子,梦幻仙境、蘑菇花草):

可以看到效果还是非常不错的,符合描述内容。

可是,随着AIGC的爆火后,不少人将它用于灰色或者违法产业,通过AI去生成不符合版权、违规的图片非法获利、混淆视听。严重危害了广大群众的财产,甚至是社会稳定:

庆幸的是,合合信息研发了AI生成图片鉴别技术,用于帮助个人及机构识别判断AI图片是否为生成的,防止“虚拟人”欺诈,通过解决生成式AI面临的部分伦理问题,助力生成式AI的健康发展:

合合信息基于空域与频域关系建模,输入图片后,模型通过多个空间注意力头来关注空间特征,并使用纹理增强模块放大浅层特征中的细微伪影,增强模型对真实人脸和伪造人脸的感知与判断准确度。能够在不用穷举图片的情况下,利用多维度特征来分辨真实图片和生成式图片的细微差异,解决了生成出来的图像场景繁多,不能穷举、有些生成图和真实图片的相似度过高,难以判别的两大难点。

该项技术的出现,在反诈骗、版权保护等领域的应用空间十分广泛。例如在金融行业,不法分子可利用AI合成技术对线上资金进行盗刷,威胁公民财产安全。本项技术可通过对支付环节的干预,降低资金盗刷概率;在传媒行业,某些图片供给方使用软件自动生成海报等图片,故意隐瞒其来源并售卖给第三方,第三方在不知情的情况下进行商用,导致了侵权问题,相关检测技术可在一定程度上解决这些问题。

3)OCR对抗攻击技术

相信大家在日常生活中,出于工作或其他业务的需要几乎都会遇到拍摄自己的证件照发送给第三方的情况,这些图片上承载的个人信息通常都是个人隐私,除了第三方和自己外不希望被别人获取。一但被别有用心的不法分子使用OCR技术识别提取并泄露,那会造成比较大的损失,比如新闻上经常看到的,身份信息被拿来搞电信诈骗,后面追责下来把自己送进监狱了,简直是无妄之灾!

市面上也有此类的对抗攻击技术来避免这样情况的出现,比如通过下面四种方式对图像进行加密,避免OCR的识别:

  1. 图像干扰:攻击者通过添加噪声、模糊化、旋转、变形等操作来干扰OCR系统对图像的识别。为了对抗这种攻击,OCR系统需要通过图像增强、边缘检测等技术来提高对图像的处理能力。

  2. 文字扰乱:攻击者通过在文本中插入其他字符、修改字符间距、改变字体等方式来扰乱OCR系统对文字的识别。为了对抗这种攻击,OCR系统需要通过设计更加鲁棒的字体和字符匹配算法。

  3. 对抗生成网络(GAN):对抗生成网络是一种通过训练生成器和判别器来同时提高生成样本的质量和判别样本真伪的技术。攻击者可以使用GAN生成看似真实但对OCR系统产生干扰的图像。为了对抗这种攻击,OCR系统需要通过对抗性训练、加入额外的鉴别器等方法提高对伪造图像的检测能力。

  4. 对抗样本生成:攻击者可以通过添加特定的噪声或干扰来改变图像,使得OCR系统产生错误的识别结果。为了对抗这种攻击,OCR系统需要采用强大的对抗样本检测算法,以便及时识别并拒绝对抗样本。

合合信息在此基础上也做了进行了创新技术探索,研发了OCR对抗攻击技术来进行文档图片“加密”,以防止不法分子使用OCR技术识别和提取其中的个人信息,该技术可在不影响肉眼观看与判断的情况下,对场景文本或者文档内文本进行扰动,对包含中文、英文、数字等关键信息的内容进行“攻击”,防止第三方通过OCR系统读取并保存图像中所有的文字内容,降低数据泄露的风险,以此达到保护信息的目的:

三、总结

通过AI,可以制作虚假的图片和新闻报道、以此破坏媒体的可信度和新闻的真实性。这可能导致公众对媒体和新闻的信任度下降,影响舆论和社会稳定。毫不夸张的说,AI造假技术对媒体、法律、政治、娱乐、社交媒体和个人安全等多个行业都会带来巨大的影响。

所以,检测这些造假信息的研究和开发对于保护社会安全和维护公正正义具有重要意义。合合信息AI图像内容检测产品的出现,在保护图像真实性和识别文本方面发挥了重要的作用。 通过自动化、高准确性和多样化的检测功能,这些技术能够帮助用户检测和防御图像篡改、生成式图像欺骗和OCR对抗攻击等问题。然而,我们仍然需要不断努力和创新,以应对不断变化和复杂化的篡改和伪造手段。只有这样,我们才能够更好地应对图像篡改和伪造问题,维护社会的稳定和公正。

值得高兴的是,中国信通院已牵头启动了《文档图像篡改检测标准》制定工作,该项标准由中国信通院牵头,上海合合信息科技股份有限公司、中国图象图形学学会、中国科学技术大学等科技创新企业及知名学术机构联合编制。以期为文档图像内容安全提供可靠保障,助力新时代AI安全体系建设。基于产业现状,围绕“细粒度”视觉差异伪造图像鉴别、生成式图像判别、文档图像完整性保护等行业焦点议题,凝聚行业共识,以期为行业提供有效指引,挖掘文档图像篡改检测技术趋势,助力图像产业健康成长。

相信随着该项标准的制定以及这么多顶尖企业的努力,将会为该行业注入更多的安全感和稳定性。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/43211.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

子网划分路由网卡安全组

1."IPv4 CIDR" "IPv4 CIDR" 是与互联网协议地址(IP address)和网络的子网划分有关的概念。 - "IPv4" 代表 "Internet Protocol version 4",也就是第四版互联网协议,这是互联网上最广泛使…

谷歌插件(Chrome扩展) “Service Worker (无效)” 解决方法

问题描述: 写 background 文件的时候报错了,说 Service Worker 设置的 background 无效。 解决(检查)方法: 检查配置文件(manifest.json) 中的 manifest_version 是否为 3。 background 中的…

办公软件ppt的制作

毕业找工作太难了,赶紧多学点什么东西吧,今天开始办公软件ppt的制作学习。 本文以WPS作为默认办公软件,问为什么不是PowerPoint,问就是没钱买不起,绝对不是不会破解的原因。 一.认识软件 在快捷工具栏中顾名思义就是一…

6.4.2 互联网路由探测与发现基本原理

6.4.2 互联网路由探测与发现基本原理 一、路由探测与发现背后的协议工作过程 我们主要使用三种方法来实现路由探测与发现 基于IP的记录路由选项功能(RR)和ICMP功能的路由探测,典型的例子就是带有参数“r”的ping命令,即ping -r …

postgresql源码学习(58)—— 删除or重命名WAL日志?这是一个问题

最近因为WAL日志重命名踩到大坑,一直很纠结WAL日志在什么情况下会被删除,什么情况下会被重命名,钻研一下这个部分。 一、 准备工作 1. 主要函数调用栈 首先无用WAL日志的清理发生检查点执行时,检查点执行核心函数为CreateCheckPo…

华为OD机试真题 Java 实现【经典屏保】【2023 B卷 100分】,附详细解题思路

目录 专栏导读一、题目描述二、输入描述三、输出描述四、补充说明四、解题思路五、Java算法源码六、效果展示1、输入2、输出3、再输入4、再输出 华为OD机试 2023B卷题库疯狂收录中,刷题点这里 专栏导读 本专栏收录于《华为OD机试(JAVA)真题&…

Mysql基础(下)之函数,约束,多表查询,事务

👂 回到夏天(我多想回到那个夏天) - 傲七爷/小田音乐社 - 单曲 - 网易云音乐 截图自 劈里啪啦 -- 黑马Mysql,仅学习使用 👇原地址 47. 基础-多表查询-表子查询_哔哩哔哩_bilibili 目录 🦂函数 &#x1f3…

使用Plist编辑器——简单入门指南

本指南将介绍如何使用Plist编辑器。您将学习如何打开、编辑和保存plist文件,并了解plist文件的基本结构和用途。跟随这个简单的入门指南,您将掌握如何使用Plist编辑器轻松管理您的plist文件。 plist文件是一种常见的配置文件格式,用于存储应…

docker - prometheus+grafana监控与集成到spring boot 服务

一、Prometheus 介绍 1.数据收集器,它以配置的时间间隔定期通过HTTP提取指标数据。 2.一个时间序列数据库,用于存储所有指标数据。 3.一个简单的用户界面,您可以在其中可视化,查询和监视所有指标。二、Grafana 介绍 Grafana 是一…

Kubernetes对象深入学习之四:对象属性编码实战

欢迎访问我的GitHub 这里分类和汇总了欣宸的全部原创(含配套源码):https://github.com/zq2599/blog_demos 本篇概览 本文是《Kubernetes对象深入学习》系列的第四篇,前面咱们读源码和文档,从理论上学习了kubernetes的对象相关的知识&#xff…

spring复习:(50)@Configuration注解配置的singleton的bean是什么时候被创建出来并缓存到容器的?

一、主类: 二、配置类: 三、singleton bean的创建流程 运行到context.refresh(); 进入refresh方法: 向下运行到红线位置时: 会实例化所有的singleton bean.进入finisheBeanFactoryInitialization方法: 向下拖动代…

(双指针) 剑指 Offer 57 - II. 和为s的连续正数序列 ——【Leetcode每日一题】

❓ 剑指 Offer 57 - II. 和为s的连续正数序列 难度:简单 输入一个正整数 target ,输出所有和为 target 的连续正整数序列(至少含有两个数)。 序列内的数字由小到大排列,不同序列按照首个数字从小到大排列。 示例 1…

【CMU15-445 FALL 2022】Project #1 - Buffer Pool

About 实验官网 Project #1 - Buffer Pool在线评测网站 gradescope Lab Task #1 - Extendible Hash Table 详见——【CMU15-445 FALL 2022】Project #1 - Extendable Hashing 如果链接失效,请查看当前平台我之前发布的文章。 Task #2 - LRU-K Replacement Polic…

Hadoop——DataGrip连接MySQL|Hive

1、下载 DataGrip下载:DataGrip: The Cross-Platform IDE for Databases & SQL by JetBrains 2、破解 破解链接:https://www.cnblogs.com/xiaohuhu/p/17218430.html 3、启动环境 启动Hadoop:到Hadoop的sbin目录下右键管理员身份运行…

计算机服务器被devos勒索病毒攻击怎么解决,数据库解密恢复方式

科学技术的发展为企业的生产运行提供了极大的便利性,但随之而来的网络安全也应该引起人们的重视。近期,我们收到很多企业的求助,企业的计算机服务器内的数据库被devos后缀勒索病毒攻击,导致企业许多工作无法正常运行。Devos后缀勒…

每天五分钟计算机视觉:单卷积层的前向传播过程

什么是单卷积层? 一张图片(输入)经过多个卷积核卷积就会得到一个输出,而这多个卷积核的组合就是一个单卷积层。 这些卷积核可能大小是不一样的,但是他们接收同样大小是输入,他们的输出必须是一般大小,所以不同的卷积核需要具备不同的步长和填充值。 单层卷积网络前向传…

大数据分析案例-基于LightGBM算法构建乳腺癌分类预测模型

🤵‍♂️ 个人主页:艾派森的个人主页 ✍🏻作者简介:Python学习者 🐋 希望大家多多支持,我们一起进步!😄 如果文章对你有帮助的话, 欢迎评论 💬点赞&#x1f4…

微服务如何治理

微服务远程调用可能有如下问题: 注册中心宕机; 服务提供者B有节点宕机; 服务消费者A和注册中心之间的网络不通; 服务提供者B和注册中心之间的网络不通; 服务消费者A和服务提供者B之间的网络不通; 服务提供者…

安装redis,适配阿里云服务器,Liunx安装redis

下载redis以及编译安装 下载redis文件 wget http://download.redis.io/releases/redis-6.0.8.tar.gz #下载redis压缩文件 tar xzf redis-6.0.8.tar.gz #解压缩 cd redis-6.0.8 make 查看是否安装了gcc编译输入gcc --version如果没有…

数据仓库表设计理论

数据仓库表设计理论 数仓顾名思义是数据仓库,其数据来源大多来自于业务数据(例如:关系型数据库),当设计数仓中表类型时(拉链表、增量表、全量表、流水表、切片表)时,应先观察业务数据的特点再设计数仓表结构 首先业务数据是会不断增长的-即…
最新文章