论文阅读 10 | Instance Credibility Inference for Few-Shot Learning

小样本学习的实例可信度推理

  • 作者
  • 摘要
  • 1. Introduction
  • 2. Related Work

作者

author

摘要

  小样本学习(FSL)旨在识别每个类别极其有限的训练数据的新对象。以前的努力是通过利用元学习范式或数据增强中的新原理来缓解这个极其缺乏数据的问题。相比之下,本文提出了一种简单的统计方法,称为实例可信度推断(ICI),以利用未标记实例的分布支持进行小样本学习。具体来说,我们首先用标记的少量样本训练线性分类器,并使用它来推断未标记数据的伪标记。为了衡量每个伪标记实例的可信度,我们提出通过增加附带参数的稀疏度来解决另一个线性回归假设,并根据其稀疏度对伪标记实例进行排名。我们选择最值得信赖的伪标记实例与标记实例一起重新训练线性分类器。该过程被迭代,直到所有未标记的样本被包括在扩展的训练集中,即,伪标记对于未标记的数据池是收敛的。在两个小样本设置下的大量实验表明,我们的简单方法可以在四个广泛使用的小样本学习基准数据集上建立新的最先进的技术,包括 miniImageNet, tieredImageNet, CIFAR-FS和CUB。我们的代码可从以下网址获得:https://github.com/Yikai-Wang/ICI-FSL

1. Introduction

  从一个或几个例子中学习是人类的一种重要能力。例如,孩子们只要看一眼书中的图片,或者听到它看起来像一只长脖子的鹿的描述,就可以毫无问题地形成“长颈鹿”的概念。相比之下,最成功的识别系统[20,42,14,16]仍然高度依赖于大量的标记训练数据。因此,这增加了稀有数据收集(例如,自动驾驶场景中的事故数据)和昂贵的数据注释(例如,用于医疗诊断的疾病数据)的负担,并且更根本地限制了它们对现实世界中的长尾类别的开放式学习的可扩展性。

  受这些观察结果的启发,最近对小样本学习的研究兴趣重新抬头[10,43,46,53]。它的目标是识别每个类别的训练数据极其有限的新对象。基本上,小样本学习模型有机会访问具有许多标记训练实例的源/基础数据集进行模型训练,然后能够泛化到仅具有稀缺标记数据的不相交但相关的目标/新数据集。将学习到的知识转移到新集合的最简单基线是微调(fine-tuning)[57]。然而,这将导致严重的过拟合,因为一个或几个实例不足以对新类的数据分布进行建模。数据增强和正则化技术可以减轻这种有限数据状态下的过拟合,但它们不能解决它。最近的几项努力是通过模拟训练过程中的小样本场景来利用学习来学习或元学习范式[24]。然而,Chen等人。[7]根据经验认为,与具有与深度特征提取器耦合的线性分类器的简单基线相比,这种学习范式通常导致较差的性能。

  给定这样一个有限的数据制度(每个类别一个或几个标记的例子),小样本学习的基本问题之一是,人们很难估计数据分布,而不引入归纳偏差。为了解决这个问题,两种类型的策略诉诸于超越传统归纳小样本学习的新类别的数据分布建模:(i)半监督少量学习(SSFSL)[28,37,45]假设我们可以利用未标记数据(大约是标记数据的十倍)来帮助学习模型;此外,(ii)用于小样本学习(TFSL)[28,34]的转导推理[18]假设我们可以访问所有测试数据,而不是在推理过程中逐个评估它们。换句话说,小样本学习模型可以利用测试示例的数据分布。

  自学[35]是利用未标记数据信息的最直接方法之一。通常,经训练的分类器推断未标记数据的标签,其被进一步采取以更新分类器。然而,推断的伪标签可能并不总是可信的;错误标记的实例可能危害分类器的性能。因此,调查每个未标记实例的标记置信度是至关重要的。

  为此,我们提出了一个简单的统计方法,被称为实例可信度推断(ICI),利用分布支持的未标记的实例小样本学习。具体地,我们首先训练线性分类器(例如,逻辑回归),并使用它来推断未标记数据的伪标记。我们的模型的目的是迭代地选择最值得信赖的伪标记的实例,根据他们的可信度所提出的ICI增加训练集。因此,分类器可以逐步更新并进一步推断未标记的数据。我们迭代这个过程,直到所有未标记的样本都包含在扩展的训练集中,即伪标签对于未标记的数据池收敛。示意图如图1所示。
图1
图1. 我们提出的框架的示意图。在N-way-m-shot FSL任务的推理过程中,我们嵌入每个实例,推理每个未标记数据,并使用ICI选择最值得信赖的子集来扩展支持集。重复该过程,直到所有未标记的数据都包括在支持集中。

  基本上,我们通过ICI算法重新使用标准的自学学习算法。如何选择伪标记数据以排除错误预测的样本,即,排除由自学学习策略引入的噪声?我们的直觉是,样本选择算法既不能仅依赖于标签空间(例如,基于分类器给出的每个类别的概率),也不能仅依赖于特征空间(例如,选择与训练数据最相似的样本)。相反,我们通过将每个实例(标记和伪标记)从特征回归到标签空间来引入线性回归假设,并增加附带参数[9]的稀疏性,直到它消失。因此,我们可以排名的伪标记的实例与稀疏度作为其可信度。我们进行了大量的实验,主要的小样本拍摄学习数据集,以验证我们所提出的算法的有效性。

  这项工作的贡献如下:(i)我们提出了一种简单的统计方法,称为实例可信度推断(ICI),以利用未标记实例的分布支持进行小样本学习。具体来说,我们的模型迭代地选择伪标记的实例,根据其可信度所衡量的建议ICI分类器训练。(ii)我们通过我们提出的ICI重新使用标准自学学习算法[35]。为了测量每个伪标记实例的可信度,我们通过增加附带参数[9]的稀疏度来解决另一个线性回归假设,并将稀疏度排名为每个伪标记实例的可信度。(iii)在两个小样本设置下的大量实验表明,我们的简单方法可以在四个广泛使用的小样本学习基准数据集上建立新的最先进的技术,包括miniImageNet,tieredImageNet,CIFARFS和CUB。

2. Related Work

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/4383.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

taro--之使用nutui组件库

安装 Taro 脚手架# 使用 npm 安装 CLI npm install -g tarojs/cli# 使用 yarn 安装 CLI yarn global add tarojs/cli# 使用 cnpm 安装 CLI cnpm install -g tarojs/cli使用 NutUI 模板创建项目1、使用命令创建 Taro 项目:taro init myApp2、按照下方图片依次选择&am…

ChatGPT如何批量撰写最新的热点自媒体文章

如何用ChatGPT创作高质量的自媒体文章 自媒体已成为互联网上的一个重要组成部分,无论您是想在社交媒体、博客中发布内容,高质量的文章都是自媒体成功的重要组成部分。ChatGPT是一个智能文章生成器,能够帮助创作者快速、高效地生成高质量的自…

数据结构——二叉搜索树

一、二叉搜索树概念 二叉搜索树又叫二叉排序树,它或是空树,或是具有以下性质的二叉树: (1)若它的左子树不为空,则左子树上的所有节点的值都小于根节点的值; (2)若它的…

LeetCode-718. 最长重复子数组

目录题目思路动态规划遇到的坑动态规划(优化)题目来源 718. 最长重复子数组 题目思路 用二维数组可以记录两个字符串的所有比较情况,这样就比较好推递推公式了。 动态规划 1.确定dp数组(dp table)以及下标的含义 dp[i][j]的定义也就决定…

【云原生】我将ChatGPT变成Kubernetes 和Helm 终端

{kubectl get po,deploy,svc}{kubectl run --imagenginx nginx-app --port80 --env“DOMAINcluster”}{kubectl expose deployment nginx-app --port80 --namenginx-http}{kubectl get po,svc,deploy}{curl 10.100.67.94:80}{helm…

Spring事务

目录 手动操作 声明式提交 注解的属性 事务隔离级别 事务传播机制 事务可以将一组操作封装成为一个单元,一组操作要么全部成功,要么全部失败 Mysql中操作事务,有三个步骤; 1、start transaction ;开启事务 2、com…

springboot 整合Mybatis-Plus分页、自动填充功能

springboot 整合Mybatis-Plus分页、自动填充功能功能 此次分页、自动填充功能的实现是在Spring Boot整合 druid、Mybatis-plus实现的基础上完成的,包括数据源配置、各种依赖添加、mapper和service的实现。不在重复记录。 Java开发手册要求数据表必须要有三个字段&am…

【lwIP(第九章)】ICMP协议

目录一、ICMP协议简介1. ICMP协议类型与结构2. ICMP 差错报文3. ICMP 查询报文二、ICMP协议原理1. ICMP报文数据结构2. ICMP的差错报文3. 差错报文的原理4. ICMP的查询报文一、ICMP协议简介 ICMP协议是一个网络层协议。 一个新搭建好的网络,往往需要先进行一个简单的…

为什么说学人工智能一定要学Python?

学习人工智能需要掌握大量的数据处理和算法实现,而Python作为一种高级编程语言,具有简单易学、灵活多变、开源丰富的库等优点,成为了人工智能领域广泛应用的语言之一。 具体来说,Python在人工智能中的优势包括: ​​…

Matlab群体智能优化算法之巨型睡莲优化算法(VAO)

Matlab群体智能优化算法之巨型睡莲优化算法(VAO) 摘要:介绍一种新型智能优化算法,巨型睡莲优化算法。其应用于24个基准测试函数,并与其他10个著名算法进行了比较。提出的算法在10个优化问题上进行了测试:最小生成树、枢纽位置分配…

Nginx学习(9)—— 负载均衡模块

文章目录Nginx负载均衡模块负载均衡配置指令钩子初始化配置初始化请求peer.get和peer.free回调函数小结Nginx负载均衡模块 负载均衡模块用于从”upstream”指令定义的后端主机列表中选取一台主机。nginx先使用负载均衡模块找到一台主机,再使用upstream模块实现与这…

HTTP代理端口是什么意思?

HTTP代理端口是指代理服务器所使用的端口。代理服务器是一种介于客户端和服务器之间的计算机系统,它可以拦截客户端发送给服务器的请求,并将其转发到服务器。而HTTP代理端口则是代理服务器上专门用于处理HTTP请求和响应的端口号。默认情况下,…

【Java】JavaSE概要

整理:【狂神说Java】JavaSE阶段回顾总结_哔哩哔哩_bilibili JavaSE概要 简介 JDK:开发者工具包 JRE:运行环境 //Hello.java public class Hello{public static void main(String[] args){System.out.println("Hello,World!");} }…

Redis数据库

一、关系数据库与非关系型数据库概述 1、关系型数据库 关系型数据库是一个结构化的数据库,创建在关系模型(二维表格模型)基础上,一般面向于记录。 SQL 语句(标准数据查询语言)就是一种基于关系型数据库的语…

Spring Boot基础学习之(六):前后端交互实现用户登录界面

本篇博客写的内容,是一个系列,内容都是关于spring boot架构的学习,实现前后端交互,极大的解放双手spring boot学习系列这是关于spring boot的专栏,后期也会不定期进行更新。内容都是有序号的,一步接着一步。…

有人物联口红DTU DR154配置与RS 485传感器数据处理

一、硬件设备 (1)有人物联口红DTU DR154(RS 485版本) 这个DTU非常给力,不用插卡自带esim卡,送8年流量,配置的话通过小程序【联博士】蓝牙配置(手机扫描DTU背后的二维码即可&#x…

界面开发框架Qt新手入门教程 - 项目视图示例介绍

Qt 是目前最先进、最完整的跨平台C开发工具。它不仅完全实现了一次编写,所有平台无差别运行,更提供了几乎所有开发过程中需要用到的工具。如今,Qt已被运用于超过70个行业、数千家企业,支持数百万设备及应用。Qt提供了许多功能&…

java基础问答

57、synchronized 各种加锁场景的作用范围 1.作用于非静态方法,锁住的是对象实例(this),每一个对象实例有一个锁。 public synchronized void method() {} 2.作用于静态方法,锁住的是类的Class对象,因为Cl…

chatgpt+安全机器人控制器+底盘一体化方案设计构想

“你有没有想过,你只需告诉你的家庭助理机器人:‘请加热我的午餐’,它就会自己找到微波炉。这是不是很神奇?” 近日,微软在其官网发表了一篇名为《机器人 ChatGPT:设计原则和模型能力(ChatGPT …

MongoDB 6.0 入门(一)

为什么研究MongDB 6.0 今天和老大聊天 聊到了一个场景的设计,我刚开始推荐了 clickhouse ,然后老大指出 前两天 测试的结果,因为clickhouse 因为 是列式存储,导致我们要查询一行数据,需要200ms(库中有2000…