(论文阅读26/100)Weakly-supervised learning with convolutional neural networks

26.文献阅读笔记

简介

题目

Weakly-supervised learning with convolutional neural networks

作者

Maxime Oquab,Leon Bottou,Ivan Laptev,Josef Sivic,CVPR,2015

原文链接

http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Oquab_Is_Object_Localization_2015_CVPR_paper.pdf

关键词

CNN,multi-classification

研究问题

通过bounding boxes标注的图像分类具有一定的问题:通过边界框一致地标注物体的位置和尺度,对部分遮挡和裁剪的物体效果不佳;对物体部分的标注很困难。

所以直接对图像内的物体种类进行标注然后训练(弱监督学习)。

研究方法

a weakly supervised convolutional neural network (CNN) for object classification that relies only on image-level labels;

用于物体分类的弱监督卷积神经网络( CNN )仅依赖于图像级别的标签,而不依赖于object bounding boxes。

只标注图片包含的对象列表,而不标注对象的位置。

在Alexnet的基础上.

前五个卷积层是在Imagenet上进行训练的,后面的几层是在Pascal数据集上进行训练的.

First, we treat the last fully connected network layers as convolutions to cope with the uncertainty in object localization.

首先,将最后一个全连接网络层看作卷积层,以应对目标定位中的不确定性。

可以处理几乎任意大小的图像作为输入。

Second, we introduce a max-pooling layer that hypothesizes the possible location of the object in the image.

其次,在输出端添加单个全局最大池化层显式搜索图像中得分最高的对象位置。

Third, we modify the cost function to learn from image-level supervision.

  • 修改了代价函数以借鉴图像级监督。

将任务视为每个类单独的二分类问题。因此,损失函数是K个二元Logistic回归损失之和。

k ∈ {1 · · · K}

F:分类结果

Y:标签值

每一个类别分数fk (x)可以解释为一个后验概率,表示图像x中k类的存在

解决多尺度问题:对所有训练图像进行缩放,使其最大边长为500像素,并将其补零至500 × 500像素。然后,每个训练小批量的16幅图像通过在0.7到1.4之间均匀采样的比例因子进行缩放。这使得网络可以看到图像中不同尺度的物体。

定位的衡量标准,作者是将max-pooling的输出映射到原图,然后将结果与bounding-box标注的结果进行比较,容忍度为18个像素,即将bounding-box向外扩18个像素,如果结果在此之内,则认为定位正确。

研究结论

可以从包含多个物体的杂乱场景中学习。

修改后的CNN架构在仅训练输出图像级标签的同时,对训练图像中的物体或其独特部分进行了定位。

弱监督网络可以预测场景中物体的大致位置(在x , y位置的形式),但不能预测物体的范围(包围盒)。

在测试时间内只搜索六个不同的尺度就足以达到良好的分类性能。在比例尺上增加更宽或更细的搜索并没有带来额外的好处。

创新不足

判断定位的标准是作者定义的,不是通用的

额外知识

none

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/138161.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

红海云签约湘湖实验室,助力科研机构人力资源数字化全面升级

湘湖实验室(农业浙江省实验室)是由浙江省农业科学院和萧山区人民政府共同举办的新型研发机构,定位为农业核心种质资源生物制造与生物互作科学问题和核心技术研究,瞄准世界农业科技发展前沿,面向国家重大战略&#xff0…

OA+CRM+HR+ERP 客户关系 进销存 财务 办公审批系统源码

功能介绍 1、个人中心 电话薄:主要用于添加联系人信息,相当于通讯录功能,可以存贮相关联系人的基本信息,姓名、联系方式、地址、邮箱等。 工作日志 :主要用于记录个人工作生活中大小事情的备忘,相当于备…

【uniapp uview】u--textarea组件custom validator check failed for prop “confirmType“

加一行&#xff1a;confirmType"done"即可。<UTextarea> at node_modules/uview-ui/components/u-textarea/u-textarea.vue<UTextarea> at node_modules/uview-ui/components/u--textarea/u--textarea.vueat pages/notice/noticeDetail.vueuview 文档地址…

前端瀑布流怎么布局

假设你需要把页面搭建成这样&#xff0c;有两列元素&#xff0c;每个元素宽度一定&#xff0c;高度不一定。如何实现&#xff1f; 这种瀑布流布局有很多实现方式&#xff0c;比如Grid布局。 什么是Grid布局 Grid布局是一种很灵活的布局方式&#xff0c;他把你的页面划分成了很…

拆解软件定义汽车:OS突围

软件作为智能汽车的核心组成部分&#xff0c;由于自身较为独立和复杂的IT学科体系&#xff0c;其技术链路、产业分工、价值分配、商业模式相对硬件产品&#xff08;如域控、激光雷达、摄像头等硬件&#xff09;而言&#xff0c;在汽车产业内探讨和传播相对较少。 11月3日&…

算法——图——bsf 广度优先搜索算法 (Breadth First Search)

图遍历算法——bsf 广度优先搜索算法 &#xff08;Breadth First Search&#xff09; 算法 概述算法过程步骤一&#xff1a;初始化原点到队列步骤二&#xff1a;将队列的头顶点放入到已完成集合步骤三&#xff1a;将订单的关联顶点放入到队列中步骤四&#xff1a;将u顶点设置为…

代码随想录算法训练营第23期day49| 123.买卖股票的最佳时机III、188.买卖股票的最佳时机IV

目录 一、&#xff08;leetcode 123&#xff09;买卖股票的最佳时机III 二、&#xff08;leetcode 188&#xff09;买卖股票的最佳时机IV 一、&#xff08;leetcode 123&#xff09;买卖股票的最佳时机III 力扣题目链接 增加了两次的限制&#xff0c;相应的就是需要考虑的状…

【正点原子STM32连载】 第五十章 FATFS实验 摘自【正点原子】APM32F407最小系统板使用指南

1&#xff09;实验平台&#xff1a;正点原子stm32f103战舰开发板V4 2&#xff09;平台购买地址&#xff1a;https://detail.tmall.com/item.htm?id609294757420 3&#xff09;全套实验源码手册视频下载地址&#xff1a; http://www.openedv.com/thread-340252-1-1.html## 第五…

解决@Autowired警告

一.前言 再使用springboot自动注入Autowired注解时,下方会出现波浪线警告,这是什么原因呢?我们细看提示说明已经说的很清楚了,Field injection is not recommended “不建议使用字段注入”,字段注入是指通过直接将依赖项注入到类的字段中来实现依赖注入。这种方式存在一些问题…

Lightroom Classic 2023 v12.4

Lightroom Classic 2023是一款图像处理软件&#xff0c;是数字摄影后期制作的重要工具之一。与其他图像处理软件相比&#xff0c;Lightroom Classic具有以下特点&#xff1a; 高效的图像管理&#xff1a;Lightroom Classic提供了强大的图像管理功能&#xff0c;可以轻松导入、…

Unit3:贪心算法

文章目录 一、介绍二、分数背包问题问题描述分析时间复杂度伪代码案例彩蛋 三、活动选择问题问题描述分析伪代码时间复杂度拓展&#xff1a;加权活动选择分析计算伪代码时间复杂度案例 对比动态规划和贪心算法 四、哈夫曼编码分类定长编码 目标变长码 案例分析伪代码时间复杂度…

halcon获取轮廓属性的时候报错:Contour attribute not defined(HALCON错误代码:3261)

报错截图&#xff1a; 在使用以下算子&#xff0c;获取xld的distance属性时&#xff0c;或者其他属性时报错。 get_contour_attrib_xld (ObjectSelected, distance, Attrib) 如果是属性报错。这里需要在调用获取轮廓属性之前先获得轮廓之间的距离。 使用以下算子&#xff1a;…

设置专属链接的这些作用你知道吗?

专属链接作为一种个性化的链接&#xff0c;用于为特定的客户或群体提供定制化的体验或服务。对于企业来说&#xff0c;每个渠道或者每个客户都能拥有一个专属链接是无比便利的事情。企业可以将这个链接嵌入到各种宣传物料中&#xff0c;让客户通过输入链接即可进入与客服的交流…

壁灯外贸出口的UL1598检测标准解析

壁灯是安装在室内墙壁上的辅助照明装饰灯具&#xff0c;一般多配用乳白色的玻璃灯罩。灯泡功率多在15-40瓦左右&#xff0c;光线淡雅和谐&#xff0c;可把环境点缀得优雅、富丽&#xff0c;尤以新婚居室特别适合。壁灯的种类和样式较多&#xff0c;一般常见的吸顶灯、变色壁灯、…

红队专题-从零开始VC++C/S远程控制软件RAT-MFC-超级终端

红队专题 招募六边形战士队员[16]超级终端(1) 招募六边形战士队员 一起学习 代码审计、安全开发、web攻防、逆向等。。。 私信联系 [16]超级终端(1) 服务端 — 本地打开cmd — 接收命令 — 执行 — 发送回显 客户端 — 远端发送命令 — 接收回显 发送开启cmd命令 --- 接受…

vue-组件注册及使用

​&#x1f308;个人主页&#xff1a;前端青山 &#x1f525;系列专栏&#xff1a;Vue篇 &#x1f516;人终将被年少不可得之物困其一生 依旧青山,本期给大家带来vue篇专栏内容-组件注册及使用 目录 1、组件的注册及使用 2、组件常用属性 2.1、directive 2.2、computed 2.…

GoLong的学习之路,进阶,语法之并发(并发错误处理)补充并发三部曲

这篇文章主要讲的是如何去处理并发的错误。 在Go语言中十分便捷地开启goroutine去并发地执行任务&#xff0c;但是如何有效的处理并发过程中的错误则是一个很棘手的问题。 文章目录 recovererrgroup recover 哦对&#xff0c;似乎没写错误处理的文章。后面补上。 首先&…

低功耗蓝牙技术 > GAP和GATT介绍

GAP&#xff08;Generic Access Profile&#xff09;和GATT&#xff08;Generic Attribute Profile&#xff09;简介 在蓝牙技术的发展中&#xff0c;GAP和GATT两个协议扮演着关键的角色&#xff0c;为BLE&#xff08;低功耗蓝牙&#xff09;设备之间的通信提供了规范和框架。…

IPSec案例部署

项目拓扑与项目求 项目需求 某企业网络使用ospf作为IGP协议实现内部网络的互联互通&#xff0c;区域规划和IP规划如图所示&#xff0c;现在要求实现如下需求&#xff1a; 公司总部和分支之间互访&#xff0c;使用IPSec VPN传递流量&#xff0c;并且对其加密&#xff0c;公司内…

IntellJ IDEA利用spring initializr创建springboot项目

maven仓库修改镜像源 idea会默认从.m2目录下读取maven配置信息&#xff0c;若没有setting.xml则从maven安装目录拷贝一个setting.xml到这里 在xml中添加阿里云镜像源 <mirrors><mirror> <id>nexus-aliyun</id> <name>nexus-aliyu…
最新文章