Mutual Mean-Teaching

Mutual Mean-Teaching: Pseudo Label Refinery for Unsupervised Domain Adaptation on Person Re-identification

Mutual Mean-Teaching(MMT)的拟议框架,用于在无监督领域适应的背景下进行人员重新识别(re-ID)。Person ReID 是在不同的摄像机上识别同一个人的任务,而域适应是指在一个数据集上训练的模型在另一个具有不同特征的数据集上表现良好的能力。

该论文指出,不同数据集之间的域多样性对将一个数据集训练的re-ID模型适应另一个数据集构成了挑战。通过使用目标域上聚类算法创建的伪标签进行优化,Person ReID 的最先进的无监督域适应方法已经从源域转移了所学知识。但是,该论文指出,聚类过程所产生的不可避免的标签噪声被忽略了,这种嘈杂的伪标签极大地阻碍了模型进一步改善目标域特征表示的能力。

为了减轻噪声伪标签的影响,本文提出了一种MMT框架,该框架旨在通过离线精炼的硬伪标签和在线精炼的软伪标签以替代训练方式从目标域学习更好的特征。拟议的框架旨在软化目标域中的伪标签。

该论文指出,通常的做法是同时采用分类损失和三重损失来实现Persone ReID模型的最佳性能。但是,传统的三重损失不适用于经过微调的标签。为了解决这个问题,本文提出了一种新的 softmax-triplet 损失,以支持使用软伪三元组标签进行学习,从而实现最佳的域适应性能。

Abstract

该论文提出了一个名为Mutual Mean-Teaching(MMT)的新框架,以改善不同数据集中的人物重新识别。它在无监督域适应任务方面取得了显著改进。

introduction

本文的导言讨论了不同数据集中的人物再识别(re-ID)问题,由于领域的多样性,该问题具有挑战性。作者强调指出,最先进的Person ReID无监督域适应方法忽略了伪标签中使用的聚类算法引起的标签噪声,并提出了一种名为Mutual Mean-Teaching(MMT)的新框架来减轻这些影响。他们还引入了一种新颖的软softmax-triplet损失函数,该函数支持使用软三元组标签进行学习,从而在Persone ReID模型中实现最佳性能。总体而言,该导言阐述了他们提出的方法背后的动机和目标,该方法旨在提高现有基于深度神经网络的方法的跨数据集泛化能力,以完成个人reID任务

contributions

本文的贡献是:

  • 提出一个名为Mutual Mean-Teaching(MMT)的新框架,以改善不同数据集中的人物重新识别。

  • 引入一种无监督方法来完善目标域中的伪标签,这可以减轻噪声伪标签的影响,改善目标域上的特征表示。

  • 开发一种新的 softmax-triplet loss,支持使用软三元组标签进行学习,从而在面对面 ReID 模型中实现最佳性能。

  • 与最先进的方法相比,使用MMT框架在无监督域适应任务方面取得了显著改进。具体而言,它在市场到杜克、公爵到市场、市场到MSMT和Duke-to-MSMT的域名上分别实现了14.4%、18.2%、13.1%和16.4%的Map提高了16.4%

Literature survey

本文提出了一种跨不同数据集进行人物重新识别的新方法。在文献调查中,作者讨论了各种现有方法及其在应对光照条件、摄像机角度等跨数据集变化带来的领域适应挑战方面的局限性。

他们强调指出,这些方法大多依赖于对源域和目标域的标记数据进行监督学习,或者使用对抗训练等无监督技术来调整域间的特征分布。但是,他们指出,基于聚类的伪标签由于其简单性而被广泛使用,但它会受到标签噪声的影响,这可能会大大降低性能。

作者还回顾了最近提出的替代损失函数(例如三重损失)的著作,这些研究旨在提高深度神经网络模型在多个数据集上的泛化能力,同时强调了与之相关的一些缺点。

总体而言,本文献调查概述了当前最先进的面对面ReID任务方法,以及它们在领域适应问题方面的优缺点。

Limitations

本文的局限性包括:

  1. 所提出的方法需要在源域上进行预训练的模型,这在某些实际场景中可能不可用。

  2. 尽管 MMT 在不同数据集上实现了最先进的无监督人员 reID 性能,但它仍然落后于使用来自两个域的标记数据的监督方法或标签有限的半监督方法。

  3. 虽然软伪标签可以在一定程度上缓解标签噪声,但不能保证在训练期间仅使用基于聚类的算法就能正确识别和完善所有有噪声的样本,因为它们由于对初始化参数和超参数选择的敏感性而容易出错。

  4. 最后,尽管作者通过在三个基准数据集(Market-1501、Dukemtmc-reid 和 MSMT17)上进行的广泛实验证明了现有研究结果的改进,但进一步的评估需要考虑更具挑战性的跨域设置,例如在天气变化等不同条件下拍摄的大规模监控视频,在这些环境中,当前的模型通常会失败

Practical implications

本文的实际含义是:

  • 拟议的Mutual Mean-Teaching(MMT)框架可用于改善不同数据集中的人员重新识别,这在监控系统和安全检查站等各种应用中很有用。

  • 本文引入的在目标域中完善伪标签的无监督方法可以帮助缓解聚类算法引起的标签噪声。这可以从在不同条件下拍摄的图像中更准确地识别个人。

  • 本研究中开发的新型softmax-triplet损失支持使用软三元组标签进行学习,从而提高了同时使用分类和三元组损失的人体reID模型的性能。

总体而言,这些贡献对于开发更好的方法来识别多个摄像机或数据集中的人物具有重要的实际意义。

Methods

本文中使用的方法是:

  • Mutual Mean-Teaching(MMT)框架:这是一种新的无监督域适应方法,它使用替代训练方法完善了伪标签。它使用离线优化的硬伪标签和在线精炼的软伪标签,从目标域学习更好的特征。

  • softmax-triplet 损失函数:提出了一种名为 “softmax-triplet” 的新型三元丢失函数,该函数支持使用软三联体标签进行学习,从而在人体 reID 模型中实现最佳性能。

  • 聚类算法:作者使用诸如K-means和频谱聚类之类的聚类算法为实验生成初始的伪标签集。

总体而言,这些方法是专门为解决在执行 person reID 任务时在不同数据集或领域中调整基于深度神经网络的方法相关的挑战而设计的。

dataset

作者使用三个基准数据集来评估拟议的方法:Market-1501、Dukemtmc-reid和 MSMT17。它们通常用于Persone ReID研究,以评估基于深度神经网络的方法的跨数据集泛化能力。前两个数据集包含从安装在购物中心(市场)或大学校园(杜克大学)不同位置的摄像头捕获的图像,而第三个数据集包含从多个来源(包括监控视频、社交媒体平台等)收集的图像,由于其尺寸更大,图像条件更具多样性,因此更具挑战性。

Results

拟议的Mutual Mean-Teaching(MMT)框架在Market-to-Duke、Duke-to-Market、Marke-to-MSMT和duke-to-MSMT的无监督域改编任务上分别取得了14.4%、18.2%、13.1%和16.4%的Map的显著改进

与使用基于聚类的伪标签进行面对面ReID模型中的目标域特征学习的最先进方法相比,MMT方法通过对标签进行软细化来缓解此类算法引起的标签噪声,显示出显著的改进。

此外,与无法有效处理三元组标签的传统三元组损失相比,本文引入的新型 softmax-triplet 损失函数在经过软改进的三联标签下可以实现更好的性能。

总体而言,这些结果表明,使用无监督域适应技术(如本文介绍的技术),在个人reID应用程序中使用的基于深度神经网络的方法具有提高跨数据集泛化能力的潜力。

Conclusions

该论文提出了一种名为相互均值教学(MMT)的新型无监督域适应方法,用于人员重新识别任务。所提出的方法使用另一种训练策略对伪标签进行细化,该策略使用离线精炼的硬伪标签和在线精炼的软伪标签来从目标域学习更好的特征。

实验结果表明,在四项跨数据集实验中,即市场对杜克、杜克对市场、市场对MSMT和Duke-to-MSMT,market-to-MSMT,map分别提高了14.4%、18.2%、13.1%和16.4%。

总体而言,这项工作证明了通过相互均值教学来完善噪音伪标签的有效性,同时还强调了在面对面 reID 任务中,在基于深度神经网络的方法中,在基于深度神经网络的方法中,在处理不同数据集或域的软细化标签数据时,整合三元损失函数如何进一步提高性能

Future works

本文提出了几项未来的工作,可以探讨这些工作以改进所提出的方法并解决其中的一些局限性。这些包括:

  1. 研究用于生成噪声较少的伪标签的替代聚类算法或其他无监督技术。

  2. 探索不同的损失函数,例如中心损失或对比损失,与软伪标签相结合,进一步增强跨域的特征表示。

  3. 通过将注意力机制和图卷积网络 (GCN) 等更高级的深度学习架构纳入其模型设计来扩展 MMT 的框架。

  4. 在当前模型经常失败的艰难条件下对更大规模的数据集进行实验,可以深入了解这些方法在受控环境之外的推广效果如何

  5. 最后,使用来自源域和目标域的有限标签数据探索半监督方法也可能有助于弥合监督/无监督域适应方法性能水平之间的差距

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/649.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Vue基础23之路由第二节

Vue基础23路由路由的query参数src/router/index.jsDetail.vueHomeMessage.vue路由的query参数命名路由src/router/index.jsHomeMessage.vueApp.vue总结路由的params参数src/router/index.jsHomeMessage.vueDetail.vue总结路由 路由的query参数 src/router/index.js //该文件专…

Gehpi的网络布局

Gehpi的网络布局1. 力引导布局2. 辅助布局布局是网络可视化中的重要概念,指将点和边通过某种策略进行排布,应尽可能满足以下4个原则: 节点均匀分布在有限的区域内避免边的交叉和弯曲保持边的长度一致整体布局能反映图内在的特性 Gephi的布局…

卷积神经网络

目录卷积神经网络概述神经网络原理卷积神经网络卷积层怎么控制输出数据?如何抓取特征池化层归一化层全连接层局部感受野权值共享多卷积核池化子采样多卷积层卷积神经网络的训练前向传播BackForward反向传播权值更新过程中的卷积网络结构层的排列规律层的尺寸设置规律…

web3:区块链共识机制系列-POS(Proof of Stake)股权证明算法

web3相关学习一并收录至该博客:web3学习博客目录大全 前情衔接:web3:区块链常见的几大共识机制及优缺点 目录前言算法公式与原理算法公式运作原理以Peer Coin为例缺陷优点缺点特点分类发展历程casper协议1.什么是无成本利益关系问题2.引入casper协议解决…

SpringBoot 动态操作定时任务(启动、停止、修改执行周期)增强版

前段时间编写了一篇博客SpringBoot 动态操作定时任务(启动、停止、修改执行周期,该篇博客还是帮助了很多同学。 但是该篇博客中的方法有些不足的地方: 只能通过前端控制器controller手动注册任务。【具体的应该是我们提前配置好我们的任务&am…

selenium(4)-------自动化测试脚本(python)

webdriverAPI 一)定位元素的方式,必问 1.1)id来定位元素,前提是元素必须具有id属性,因为有的元素是没有id的 1.2)name,元素必须有name,并且必须全局唯一 1.3)tagname,元素是一定有的,但是必须全…

HTTP 缓存的工作原理

缓存是解决http1.1当中的性能问题主要手段。缓存可能存在于客户端浏览器上,也可以存在服务器上面,当使用过期缓存可能给用户展示的是错误的信息而导致一些bug。 HTTP 缓存:为当前请求复用前请求的响应 • 目标:减少时延&#xff1…

Python+Yolov8目标识别特征检测

Yolov8目标识别特征检测如需安装运行环境或远程调试&#xff0c;见文章底部个人QQ名片&#xff0c;由专业技术人员远程协助&#xff01;前言这篇博客针对<<Yolov8目标识别特征检测>>编写代码&#xff0c;代码整洁&#xff0c;规则&#xff0c;易读。 学习与应用推荐…

3分钟看完-丄-Python自动化测试【项目实战解析】经验分享

目录&#xff1a;导读 引言 自动化测试 背景 测试团队 测试体系发展 测试平台 自动化测试现状 现状一&#xff1a; 现状二&#xff1a; 现状三&#xff1a; 现状四&#xff1a; 现状五&#xff1a; 现状六&#xff1a; 失败的背景 失败的经历 失败总结 引言 内…

Java多线程系列--synchronized的原理

原文网址&#xff1a;Java多线程系列--synchronized的原理_IT利刃出鞘的博客-CSDN博客 简介 本文介绍Java的synchronized的原理。 反编译出字节码 Test.java public class Test {private static Object LOCK new Object();public static int main(String[] args) {synchro…

动态矢量瓦片缓存库方案

目录 前言 二、实现步骤 1.将数据写入postgis数据库 2.将矢量瓦片数据写入缓存库 3.瓦片接口实现 4.瓦片局部更新接口实现 总结 前言 矢量瓦片作为webgis目前最优秀的数据格式&#xff0c;其主要特点就是解决了大批量数据在前端渲染时出现加载缓慢、卡顿的问题&#xff0…

LeetCode 112. 路径总和

LeetCode 112. 路径总和 给你二叉树的根节点 root 和一个表示目标和的整数 targetSum 。判断该树中是否存在 根节点到叶子节点 的路径&#xff0c;这条路径上所有节点值相加等于目标和 targetSum 。如果存在&#xff0c;返回 true &#xff1b;否则&#xff0c;返回 false 。 叶…

Python笔记 -- 文件和异常

文章目录1、文件1.1、with关键字1.2、逐行读取1.3、写入模式1.4、多行写入2、异常2.1、try-except-else2.2、pass1、文件 1.1、with关键字 with关键字用于自动管理资源 使用with可以让python在合适的时候释放资源 python会将文本解读为字符串 # -*- encoding:utf-8 -*- # 如…

Linux操作系统基础的常用命令

1&#xff0c;Linux简介Linux是一种自由和开放源码的操作系统&#xff0c;存在着许多不同的Linux版本&#xff0c;但它们都使用了Linux内核。Linux可安装在各种计算机硬件设备中&#xff0c;比如手机、平板电脑、路由器、台式计算机。1.1Linux介绍Linux出现于1991年&#xff0c…

操作技巧 | 在Revit中借用CAD填充图案的方法

在建模过程中&#xff0c;有时需要达到多种填充效果&#xff0c;而CAD中大量的二维填充图案&#xff0c;便是最直接的资源之一。 使用 填充图案之前 使用 填充图案之后 其中要用到主要命令便是对表面填充图案的添加与编辑 简单效果 如下 模型填充与绘图填充 区别 模型填…

Java for循环嵌套for循环,你需要懂的代码性能优化技巧

前言 本篇分析的技巧点其实是比较常见的&#xff0c;但是最近的几次的代码评审还是发现有不少兄弟没注意到。 所以还是想拿出来说下。 正文 是个什么场景呢&#xff1f; 就是 for循环 里面还有 for循环&#xff0c; 然后做一些数据匹配、处理 这种场景。 我们结合实例代码来…

SpringBoot+WebSocket实时监控异常

# 写在前面此异常非彼异常&#xff0c;标题所说的异常是业务上的异常。最近做了一个需求&#xff0c;消防的设备巡检&#xff0c;如果巡检发现异常&#xff0c;通过手机端提交&#xff0c;后台的实时监控页面实时获取到该设备的信息及位置&#xff0c;然后安排员工去处理。因为…

Java实现调用第三方相关接口(附详细思路)

目录1.0.简单版2.0.升级版2-1.call.timeout()怎么传入新的超时值2-2.timeout(10, TimeUnit.SECONDS)两个参数的意思&#xff0c;具体含义3.0.进阶版3-1.java.net.SocketTimeoutException: 超时如何解决4.0.终极版1.0.简单版 以下是一个使用 Java 实际请求“第三方”的简单示例代…

一眼看破五花八门的链表结构

文章目录&#x1f4d5;一&#xff1a;五花八门的链表结构&#x1f4d6;链表与数组的简单对比&#x1f4d6;单链表&#x1f4d6;循环链表&#x1f4d6;双向链表&#x1f4d5;二&#xff1a;链表VS数组性能大比拼&#x1f47f;最后说一句&#x1f431;‍&#x1f409;作者简介&am…

数据挖掘(2.1)--数据预处理

一、基础知识 1.数据的基本概念 1.1基础知识 数据是数据对象(Data Objects)及其属性(Attributes)的集合。 数据对象(一条记录、一个实体、一个案例、一个样本等)是对一个事物或者物理对象的描述。 数据对象的属性则是这个对象的性质或特征&#xff0c;例如一个人的肤色、眼球…
最新文章