Generalist: Decoupling Natural and Robust Generalization

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-JI7Gb5rr-1680827823923)(null)]

通过原始图片在训练过程出的模型会受到敌对样本的干扰,这种问题虽然通过对抗训练增加了抵抗敌对样本的鲁棒性,但也损失了一部分自然泛化的能力。为了解决这个问题,我们将自然泛化和鲁棒泛化与联合训练解耦,并为每个训练制定不同的训练策略。具体来说,我们没有将这两个最小化泛化错误的全局损失,而是提出了一个称为Generalist的双专家框架,在这个框架中,我们同时用任务感知策略训练基础学习者,以便他们能够专注于自己的领域。在训练过程中,按间隔收集并组合基础学习者的参数,形成一个全局学习者。然后将全局学习者作为初始化参数分配给基础学习者。从理论上讲,我们证明了一旦基础学习者受过良好的训练,Generalist的风险就会降低。大量的实验验证了Generalist在自然例子上实现高精度的适用性,同时对对抗性的例子保持相当大的鲁棒性。

问题

通过原始图片在训练过程出的模型会受到敌对样本的干扰,这种问题虽然通过对抗训练增加了抵抗敌对样本的鲁棒性,但也损失了一部分自然泛化的能力。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-SnKlFfr1-1680827817099)(null)]

当最坏情况下扰动图像的误差减小时,未扰动图像的误差存在不期望的增加

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-yH8yos2T-1680827819571)(null)]

解决方法

之前的一些工作专注于:例如合并额外的标记/未标记数据或放松扰动的大小,以产生合适的对抗性例子,以便更好的优化。对于自然泛化和鲁棒泛化之间的权衡,以前的方法都在联合训练框架中努力寻找一个能够满足这两个目标的最佳点。

我们的方法:这些工作都集中在用于训练的数据上,而我们建议从本文中的训练范式的角度来解决权衡问题。

我们将对抗性训练的目标函数解耦为两个子任务:一个用于自然示例分类,另一个用于对抗性示例分类。对于每个子任务,我们在具有特定任务配置的自然/对抗性数据集上训练基础学习者,同时共享相同的模型架构。在训练过程中,收集并组合基础学习者的参数,形成一个全局学习者,然后将其作为初始化参数分配给基础学习者进行继续训练。

我们提出的Generalist充分利用特定任务的信息来单独训练基础学习者,使每个子任务得到更好地解决。

理论上,我们证明,如果基础学习者受过良好的训练,最终的全局学习者保证有一个较低的风险。对于每个任务,训练策略的每一个细节(如优化方案)都可以完全定制,因此每个基础学习者可以更好地探索其领域的最优轨迹,而全局学习者可以充分利用所有基础学习者的优点。

相关工作

Standard Adversarial Training

[论文笔记] Projected Gradient Descent (PGD) - 知乎 (zhihu.com)

Multi-Task Learning and Meta-Initialization

收藏|浅谈多任务学习(Multi-task Learning) - 知乎 (zhihu.com)

Generalist框架

优化基础学习者θa在其分配的数据分布Da中的参数和将全局学习者θg的参数分配给所有基础学习者。由于我们只关注于识别自然的例子和敌对的例子,所以任务的总数W被设置为两个。

Task-aware Base Learners

具体来说,在这个过程中,基础学习者fθn和fθr被分配不同的子问题,只需要访问自己的数据分布。

请注意,两个基础学习者的工作方式是互补的,这意味着参数的更新在基础学习者之间是独立的,而全局学习者总是收集两个基础学习者的参数。损失函数也可以是特定于任务的,并分别应用于每个基础学习者。在实践中,我们选择交叉熵作为ℓ1和ℓ2的替代损失,因为它很简单,但足够好。

所以每个基础学习者的子问题被定义为:

Initialization from the Global Learner

在最初的训练期间,基础学习者的工具性较少,因为他们没有得到充分的学习。

直接初始化基础学习者的参数可能会误导训练过程,并在混合时进一步积累偏差。

因此,我们从一开始就保留了t’epoch来完全训练基础学习者,而只是通过指数移动平均优化来聚合基础学习者的搜索轨迹上的状态。这时并不会把得到的全局学习者的参数赋值给基础学习者。

然后,当每个基础学习者在其领域得到良好的训练时,他们从每个c个时代的全局学习者的参数中学习一个初始化。

把全局学习者的参数分别赋给两个基础学习者之后,基础学习者包含不属于自己任务的参数信息,提高泛化能力。
在这里插入图片描述

理论分析

细节请看原文附录推导

考虑一种算法为两个基学习者生成状态θ1和θ2的轨迹,两个基学习者在其相应的损失函数ℓ1,ℓ2上的遗憾为

在这里插入图片描述

上述不等式表明,任何有利于减少每个任务误差的策略,使RT更小,都会降低全局学习者的误差界。

结果

消融

每个学习者定制策略

如上所述,与标准的联合训练框架相比,Generalist的主要优势之一是,每个基础学习者都能够自由地为自己的任务定制相应的策略,而不是对所有任务使用相同的策略。在这部分中,我们研究了Generalist在与不同的技术合作时是否表现得更好。

Weight Averaging

这种技术在联合训练框架中并不能同时提高准确性和鲁棒性。

结果如图4 (a).所示我们在NT(NT_only)或AT(AT_only)或两者(NT+AT)中使用WA。总体而言,结果证实了两个基础学习者利用WA后,全局学习者的表现可以进一步提高。

NT_only的标准测试精度继续提高,但以牺牲防御攻击能力的下降为代价。一个可能的原因是,WA含蓄地控制了基础学习者的学习速度。事实上,在其子任务中,有学习WA的基础学习者比没有学习WA的基础学习者要快得多,这意味着快学习者与慢学习者不一致。

Different Optimizers

在这里插入图片描述

总结

在本文中,我们提出了一个名为多面手的双专家框架来改进自然泛化和鲁棒泛化之间的权衡问题,它训练两个负责互补领域的基础学习者,并收集他们的参数来构建一个全局学习者。通过与联合训练范式的解耦,每个基础学习者都可以使用基于数据分布的定制策略。我们提供了理论分析来证明任务感知策略的有效性,并广泛的实验表明,多才手更好地减轻了准确性和鲁棒性的权衡。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/6841.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

如何有效地跟踪项目进展?

项目失败的代价很高。通过进度跟踪,你可以预见问题,并采取必要的措施引导项目回到正轨。 根据最近的一项研究,由于项目表现不佳,组织平均浪费了其总投资的11.4%。此外,在那些低估了健全项目管理的重要性的企业中&…

高频面试:如何解决MySQL主从复制延时问题

MySQL 主从一直是面试常客,里面的知识点虽然基础,但是能回答全的同学不多。 比如我之前面试小米,就被问到过主从复制的原理,以及主从延迟的解决方案,你之前面试,有遇到过哪些 MySQL 主从的问题呢&#xff…

Goby漏洞更新 | SolarView Compact downloader.php 任意命令执行漏洞(CVE-2023-23333)

漏洞名称:SolarView Compact downloader.php 任意命令执行漏洞(CVE-2023-23333 English Name:SolarView Compact downloader.php RCE (CVE-2023-23333) CVSS core: 10.0 影响资产数:5585 漏洞描述: Contec SolarV…

Java题目训练——统计每个月兔子的总数和字符串通配符

目录 一、统计每个月兔子的总数 二、字符串通配符 一、统计每个月兔子的总数 题目描述: 有一种兔子,从出生后第3个月起每个月都生一只兔子,小兔子长到第三个月后每个月又生一只兔子。 例子:假设一只兔子第3个月出生&#xff0c…

天气Weather

前言 加油 原文 天气常用会话 ❶ It looks as though it might clear up. 看起来天好像要转晴。 ❷ The forecast is not accurate. 预报不准确。 ❸ The weatherman says we’ll have a cold spell before the end of this week. 天气预报员说,在这个周末之前会有一股寒…

【数据结构与算法分析】0基础带你学数据结构与算法分析12--红黑树

红黑树 (red-black tree) 是一种自平衡二叉树,于 1972 年由 Rudolf Bayer 发明,发明时被称为 对称二叉 B 树,现代名称红黑树来自 Knuth 的博士生 Robert Sedgewick 于 1978 年发表的论文。红黑树的结构复杂,但操作有着良好的最坏情…

新的勒索软件是迄今为止最快的加密器

在一家美国公司遭到网络攻击后,恶意软件研究人员发现了一种似乎具有“技术独特功能”的新型勒索软件,他们将其命名为 Rorschach。 观察到的功能之一是加密速度,根据研究人员的测试,这将使 Rorschach 成为当今最快的勒索软件威胁。…

对Mysql的了解-索引

什么是索引? 索引是一种用于快速查询和检索数据的数据结构。常见的索引结构有: B 树, B树和 Hash。 索引的作用就相当于目录的作用。打个比方: 我们在查字典的时候,如果没有目录,那我们就只能一页一页的去找我们需要查的那个字&#xff0c…

结合基于规则和机器学习的方法构建强大的混合系统

经过这些年的发展,我们都确信ML即使不能表现得更好,至少也可以在几乎所有地方与前ML时代的解决方案相匹配。比如说一些规则约束,我们都会想到能否把它们替换为基于树的ml模型。但是世界并不总是黑白分明的,虽然机器学习在解决问题…

nacos本地启动单节点

1.官网下载 Releases alibaba/nacos GitHub 解压文件 unzip nacos-server-2.2.1.zip cd /Users/xiaosa/dev_tools/nacos/bin sh startup.sh -m standalone 启动不成功,报错入如下 原因是下面的配置为空。位置在nacos/config目录下的application.properties文件…

【英语】大学英语CET考试,导学规划与听力题答题技巧笔记(1-2)

文章目录1、课程规划和导学1.1 试卷结构和备考目标1.2 单词,听力,阅读,真题学习方法2、听力技巧课1(导学与发音)3、听力技巧课2(答题技巧!重要!)1、课程规划和导学 主讲…

C语言中宏和函数的9个区别,你都了解吗?

C语言中的宏和函数是非常相似的,它们都可以完成类似的功能。比如,想要求2个数的较大值,使用宏的写法是: // 宏的定义 #define MAX(x, y) ((x)>(y)?(x):(y))// 使用 int m MAX(10, 20);使用函数的写法是: // 函数…

[Golang从零到壹] 1.环境搭建和第三方包管理

文章目录安装go环境go.mod第一种情况,选择GOPATH第二种情况,不选择GOPATH(推荐)GO111MODULEgo module可执行文件位置安装go环境 go在安装时选择好安装目录完成安装之后,还需要设置两个环境变量:GOROOT、GOPATH GOROOT即go的安装…

UnQLite入门

本文介绍UnQLite的基本使用,包括增删改查,事务ACID 文章目录UnQLite介绍UnQLite常用接口函数返回码DemoKey/Value存储数据库游标UnQLite介绍 UnQLite简介 UnQLite是,由 Symisc Systems公司出品的一个嵌入式C语言软件库,它实现了一…

Scrapy-核心架构

在之前的文章中,我们已经学习了如何使用Scrapy框架来编写爬虫项目,那么具体Scrapy框架中底层是如何架构的呢?Scrapy主要拥有哪些组件,爬虫具体的实现过程又是怎么样的呢? 为了更深入的了解Scrapy的相关只是&#xff0…

Chatgpt 指令收集

在使用 ChatGPT 时,当你给的指令越精确,它的回答会越到位,举例来说,假如你要请它帮忙写文案,如果没给予指定情境与对象,它会不知道该如何回答的更加准确。 一、写报告 1、我现在正在 [报告的情境与目的]。…

低代码平台应该具备哪些能力?

什么样的低代码无代码平台才算好的平台呢,Gartner 共列出了低代码平台的11个关键能力维度: 1、易用性。易用性是标识低代码平台生产力的关键指标,是指在不写代码的情况下能够完成的功能的多少。 2、用户体验。一般来说,独立软件开…

2023Q2押题,华为OD机试用Python实现 -【机智的外卖员】

最近更新的博客 华为 od 2023 | 什么是华为 od,od 薪资待遇,od 机试题清单华为 OD 机试真题大全,用 Python 解华为机试题 | 机试宝典【华为 OD 机试】全流程解析+经验分享,题型分享,防作弊指南华为 od 机试,独家整理 已参加机试人员的实战技巧本篇题解:机智的外卖员 题目…

Java中的死锁

1.什么是死锁 死锁:多个线程同时被阻塞,它们中的一个或者全部都在等待某个资源被释放。由于线程被无限期的阻塞,线程不可能正常终止。 【举个栗子】滑稽老铁和女生去吃饺子。吃饺子需要醋和饺子。 滑稽老哥抄起了酱油瓶,女生抄起…

【技术教程】在EasyCVR平台中打开第三方桌面端应用的实现过程

EasyCVR视频融合平台基于云边端协同架构,具有强大的数据接入、处理及分发能力,平台支持海量视频汇聚管理,可支持多协议接入,包括市场主流标准协议与厂家私有协议及SDK,如:国标GB28181、RTMP、RTSP/Onvif、海…