【计算机视觉 | 图像分割】arxiv 计算机视觉关于图像分割的学术速递(7 月 26 日论文合集)

文章目录

  • 一、分割|语义相关(7篇)
    • 1.1 Learning Transferable Object-Centric Diffeomorphic Transformations for Data Augmentation in Medical Image Segmentation
    • 1.2 Optical Flow boosts Unsupervised Localization and Segmentation
    • 1.3 Spectrum-guided Multi-granularity Referring Video Object Segmentation
    • 1.4 Unmasking Anomalies in Road-Scene Segmentation
    • 1.5 GaPro: Box-Supervised 3D Point Cloud Instance Segmentation Using Gaussian Processes as Pseudo Labelers
    • 1.6 Image Segmentation Keras : Implementation of Segnet, FCN, UNet, PSPNet and other models in Keras
    • 1.7 Towards Unifying Anatomy Segmentation: Automated Generation of a Full-body CT Dataset via Knowledge Aggregation and Anatomical Guidelines

一、分割|语义相关(7篇)

1.1 Learning Transferable Object-Centric Diffeomorphic Transformations for Data Augmentation in Medical Image Segmentation

用于医学图像分割数据增强的可转移对象中心微分变换学习

https://arxiv.org/abs/2307.13645

在这里插入图片描述
由于需要专家进行像素级注释,因此在医学图像分割中获得标记数据具有挑战性。最近的工作已经表明,用可变形变换增强感兴趣的对象可以帮助减轻这一挑战。然而,这些变换已经被全局地学习用于图像,限制了它们在数据集之间的可转移性或在图像对准困难的问题中的适用性。虽然以对象为中心的增强提供了一个很好的机会来克服这些问题,现有的作品只集中在位置和随机变换,而不考虑对象的形状变化。为此,我们提出了一种新的以对象为中心的数据增强模型,能够学习感兴趣的对象的形状变化,并在不修改图像的其余部分的情况下增强对象。我们证明了它在改善肾脏肿瘤分割时,利用从同一数据集内学习的形状变化和从外部数据集转移。

1.2 Optical Flow boosts Unsupervised Localization and Segmentation

光流增强无监督定位和分割

https://arxiv.org/abs/2307.13640

在这里插入图片描述
无监督定位和分割是长期存在的机器人视觉挑战,描述了自主机器人学习将图像分解为没有标记数据的单个对象的关键能力。这些任务是重要的,因为有限的可用性密集的图像手动注释和有前途的愿景,适应不断变化的一组对象类别在终身学习。最近的方法集中在使用视觉外观的连续性作为对象线索的空间聚类功能获得自监督Vision Transformers(ViT)。在这项工作中,我们利用运动线索,灵感来自共同的命运原则,共享类似的运动的像素往往属于同一个对象。我们提出了一个新的损失项公式,使用光流在未标记的视频,鼓励自我监督的ViT功能变得更接近对方,如果他们相应的空间位置共享类似的运动,反之亦然。我们使用所提出的损失函数来微调最初在静态图像上训练的Vision Transformers。我们的微调过程优于最先进的技术,通过线性探测无监督语义分割,而不使用任何标记的数据。该过程还证明了在无监督对象定位和语义分割基准上,原始ViT网络的性能有所提高。

1.3 Spectrum-guided Multi-granularity Referring Video Object Segmentation

基于频谱制导的多粒度参考视频对象分割

https://arxiv.org/abs/2307.13537

在这里插入图片描述
当前的参考视频对象分割(R-VOS)技术从编码的(低分辨率)视觉语言特征提取条件核以分割解码的高分辨率特征。我们发现,这会导致显著的特征漂移,分割内核在前向计算期间难以感知。这对分割核的能力产生负面影响。为了解决漂移问题,我们提出了一个频谱引导的多粒度(SgMg)的方法,该方法对编码的功能进行直接分割,并采用视觉细节,以进一步优化掩模。此外,我们提出了光谱引导的跨模态融合(SCF)执行帧内的全球交互在光谱域有效的多模态表示。最后,我们扩展SgMg执行多对象R-VOS,一个新的范例,使视频中的多个参考对象的同时分割。这不仅使R-VOS更快,而且更实用。大量的实验表明,SgMg在四个视频基准数据集上实现了最先进的性能,在Ref-YouTube-VOS上的表现超过了最接近的竞争对手2.8%。我们的扩展SgMg使多对象R-VOS,运行速度约3倍,同时保持令人满意的性能。代码可在https://github.com/bo-miao/SgMg上获得。

1.4 Unmasking Anomalies in Road-Scene Segmentation

道路场景分割中的去掩蔽异常

https://arxiv.org/abs/2307.13316

在这里插入图片描述
异常分割是驱动应用程序的一项关键任务,传统上将其视为逐像素分类问题。然而,在不考虑其上下文语义的情况下单独地推理每个像素会导致对象边界周围的高度不确定性和许多误报。我们提出了一个范式的变化,从每像素分类转移到掩模分类。我们的面具为基础的方法,Mask 2Anomaly,证明了在一个面具分类架构的异常检测方法集成的可行性。Mask 2Anomaly包括几项旨在改善掩模异常检测的技术创新:i)全局掩蔽注意力模块,用于单独地聚焦在前景和背景区域上; ii)最大化异常和已知类别之间的裕度的掩模对比学习;以及iii)用于减少假阳性的掩模细化解决方案。Mask 2Anomaly在一系列基准测试中获得了新的最先进的结果,包括每像素和组件级评估。特别是,Mask 2Anomaly将平均误报率降低了60%。Github页面:https://github.com/shyam671/Mask2Anomaly-Unmasking-Anomalies-in-Road-Scene-Segmentation。

1.5 GaPro: Box-Supervised 3D Point Cloud Instance Segmentation Using Gaussian Processes as Pseudo Labelers

GaPro:基于高斯过程的盒式监督三维点云实例分割

https://arxiv.org/abs/2307.13251

在这里插入图片描述
3D点云(3DIS)上的实例分割是计算机视觉中的一个长期挑战,其中最先进的方法主要基于完全监督。由于注释地面实况密集实例掩码是繁琐且昂贵的,解决具有弱监督的3DIS变得更加实际。在本文中,我们提出了GaPro,一个新的实例分割三维点云使用轴对齐的三维包围盒监督。我们的两步方法涉及从框注释生成伪标签,并使用所得标签训练3DIS网络。此外,我们采用自我训练策略,以进一步提高我们的方法的性能。我们设计了一个有效的高斯过程,从边界框生成伪实例掩码,并在它们重叠时解决歧义,从而产生具有不确定性值的伪实例掩码。我们的实验表明,GaPro优于以前的弱监督3D实例分割方法,并具有竞争力的性能相比,最先进的完全监督的。此外,我们证明了我们的方法的鲁棒性,我们可以通过使用我们的伪标签进行训练,使各种最先进的完全监督方法适应弱监督任务。源代码和训练模型可在https://github.com/VinAIResearch/GaPro获得。

1.6 Image Segmentation Keras : Implementation of Segnet, FCN, UNet, PSPNet and other models in Keras

图像分割KERAS:SegNet、FCN、UNET、PSPNet等模型在KERS中的实现

https://arxiv.org/abs/2307.13215

在这里插入图片描述
语义分割在计算机视觉任务中起着至关重要的作用,可以对图像进行精确的像素级理解。在本文中,我们提出了一个全面的语义分割库,其中包含流行的分割模型,如SegNet,FCN,UNet和PSPNet的实现。我们还在多个数据集上评估和比较了这些模型,为研究人员和从业人员提供了一个强大的工具集来应对各种分割挑战。

1.7 Towards Unifying Anatomy Segmentation: Automated Generation of a Full-body CT Dataset via Knowledge Aggregation and Anatomical Guidelines

走向统一的解剖分割:通过知识聚合和解剖学指南自动生成全身CT数据集

https://arxiv.org/abs/2307.13375

在这里插入图片描述
在这项研究中,我们提出了一种用于生成自动解剖分割数据集的方法,使用一个顺序过程,涉及nnU-Net为基础的伪标签和解剖引导的伪标签细化。通过结合各种碎片化的知识库,我们生成了一个数据集的全身CT扫描与142 $体素级标签为533卷提供全面的解剖覆盖,专家已经批准。我们提出的程序不依赖于人工注释在标签聚合阶段。我们使用三个补充检查来检查其合理性和有用性:人类专家评估批准了数据集,BTCV数据集上的深度学习有用性基准,其中我们在不使用其训练数据集的情况下获得了85%的骰子分数,以及医疗有效性检查。该评估程序将可扩展的自动化检查与劳动密集型的高质量专家检查相结合。除了数据集之外,我们还发布了经过训练的统一解剖分割模型,能够预测CT数据上的142 $解剖结构。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/49757.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Profinet转EtherNet/IP网关连接AB PLC的应用案例

西门子S7-1500 PLC(profinet)与AB PLC以太网通讯(EtherNet/IP)。本文主要介绍捷米特JM-EIP-PN的Profinet转EtherNet/IP网关,连接西门子S7-1500 PLC与AB PLC 通讯的配置过程,供大家参考。 1, 新建工程&…

Python(四十八)列表的特点

❤️ 专栏简介:本专栏记录了我个人从零开始学习Python编程的过程。在这个专栏中,我将分享我在学习Python的过程中的学习笔记、学习路线以及各个知识点。 ☀️ 专栏适用人群 :本专栏适用于希望学习Python编程的初学者和有一定编程基础的人。无…

iOS开发-下拉刷新动画CAShapeLayer的strokeStart与strokeEnd指示器动画效果

iOS开发-下拉刷新动画CAShapeLayer的strokeStart与strokeEnd刷新指示器效果 之前开发中实现下拉刷新动画CAShapeLayer的strokeStart与strokeEnd指示器动画效果 一、效果图 二、基础动画 CABasicAnimation类的使用方式就是基本的关键帧动画。 所谓关键帧动画,就是…

【计算机网络】2.1——物理层(编码波形、奈氏准则和香农公式计算)

物理层 基本概念 概念 物理层考虑的是怎样才能在连接各种计算机的传输媒体上传输数据比特流 为数据链路层屏蔽了各种传输媒体的差异 数据链路层只需要考虑如何完成本层的协议和服务,而不必考虑网络具体的传输媒体是什么 物理层协议主要任务 机械特性 指明接口所…

C# 使用opencv从图片识别人脸示例

1.用chatgpt帮我写了一个示例 using System; using Emgu.CV; using Emgu.CV.CvEnum; using Emgu.CV.Structure;class Program {static void Main(string[] args){// 加载人脸分类器CascadeClassifier faceCascade new CascadeClassifier("haarcascade_frontalface_defau…

Flink任务优化分享

Flink任务优化分享 1.背景介绍 线上计算任务在某版本上线之后发现每日的任务时长都需要三个多小时才能完成,计算时间超过了预估时间,通过Dolphinscheduler的每日调度任务看,在数据层 dwd 的数据分段任务存在严重的性能问题,每天…

SQL基础使用

SQL的概述 SQL全称: Structured Query Language,结构化查询语言,用于访问和处理数据库的标准的计算机语言。 SQL语言1974年由Boyce和Chamberlin提出,并首先在IBM公司研制的关系数据库系统SystemR上实现。 经过多年发…

数值线性代数:奇异值分解SVD

本文记录计算矩阵奇异值分解SVD的原理与流程。 注1:限于研究水平,分析难免不当,欢迎批评指正。 零、预修 0.1 矩阵的奇异值 设列满秩矩阵,若的特征值为,则称为矩阵的奇异值。 0.2 SVD(分解)定理 设,则…

CTFshow-pwn入门-pwn67(nop sled空操作雪橇)

前言 本人由于今年考研可能更新的特别慢,不能把ctfshow的pwn入门题目的wp一一都写出来了,时间比较紧啊,只能做高数做累的时候做做pwn写写wp了,当然我之后只挑典型意义的题目写wp了,其余的题目就留到12月底考完之后再写…

基于OpenCV solvePnP函数估计头部姿势

人脸识别 文章目录 人脸识别一、姿势估计概述1、概述2、姿态估计3、在数学上表示相机运动4、姿势估计需要什么5、姿势估计算法6、Levenberg-Marquardt 优化 二、solvePnP函数1、函数原型2、参数详解 三、OpenCV源码1、源码路径 四、效果图像示例参考链接 一、姿势估计概述 1、…

寄存器分配:图着色算法

寄存器分配:图着色算法 背景活跃分析寄存器冲突图图着色算法溢出 背景 在编译器的中间表示中,一般会设定虚拟寄存器有无限多个(方便优化),而真实的物理寄存器是有限的,因而编译器后端在将中间表示翻译成目…

centos7安装mysql数据库详细教程及常见问题解决

mysql数据库详细安装步骤 1.在root身份下输入执行命令: yum -y update 2.检查是否已经安装MySQL,输入以下命令并执行: mysql -v 如出现-bash: mysql: command not found 则说明没有安装mysql 也可以输入rpm -qa | grep -i mysql 查看是否已…

mac下安装vue cli脚手架并搭建一个简易项目

目录 1、确定本电脑下node和npm版本是否为项目所需版本。 2、下载vue脚手架 3、创建项目 1、下载node。 如果有node,打开终端,输入node -v和npm -v , 确保node和npm的版本,(这里可以根据自己的需求去选择,如果对最新版本的内容有…

python 源码中 PyId_stdout 如何定义的

python 源代码中遇到一个变量名 PyId_stdout,搜不到在哪里定义的,如下只能搜到引用的位置(python3.8.10): 找了半天发现是用宏来构造的声明语句: // filepath: Include/cpython/object.h typedef struct …

Gradle build 失败后提示.lock文件,解决办法

在Gradle build失败之后时,有时候强制关闭AndroidStudio,再次打开build时,会提示各种.lock 文件问题,删除了一个还有下一个,而且路径不一样。 一般情况下是这两个文件夹下的lockfile影响继续build %GRADLE_HOME%/ca…

目标检测任务中常用的数据集格式(voc、coco、yolo)

一、Pascal VOC VOC数据集(Annotation的格式是xmI) Pascal VOC数据集是目标检测的常用的大规模数据集之一,从05年到12年都会举办比赛,比赛任务task: 分类Classification目标检测Object Detection语义分割Class Segmentation实例分割Object…

基于java+swing+mysql图书管理系统v8.0

基于javaswingmysql图书管理系统v8.0 一、系统介绍二、功能展示1.登陆及主页2.图书类别添加3.图书类别维护4.图书添加5.图书维护 三、系统实现1.BookManageMainFrame.java 四、其它1.其他系统实现 五、获取源码 一、系统介绍 该系统实现了用户登陆、图书类别管理(图书类别添加…

yolov5 onnx模型 转为 rknn模型

1、转换为rknn模型环境搭建 onnx模型需要转换为rknn模型才能在rv1126开发板上运行,所以需要先搭建转换环境 模型转换工具 模型转换相关文件下载: 网盘下载链接:百度网盘 请输入提取码 提取码:teuc 将其移动到虚拟机中&#xf…

基本排序算法

目录 一,插入排序 二,希尔排序 三,选择排序 四,冒泡排序 五,快排 5.1 Hoare法 5.2 挖坑法 5.3 指针法 5.4 非递归写法 六,归并排序 6.1 递归 6.2 非递归 一,插入排序 基本思想&…

CorelDraw怎么做立体字效果?CorelDraw制作漂亮的3d立体字教程

1、打开软件CorelDRAW 2019,用文本工具写上我们所需要的大标题。建议字体选用比较粗的适合做标题的字体。 2、给字填充颜色,此时填充的颜色就是以后立体字正面的颜色。我填充了红色,并加上了灰色的描边。 3、选中文本,单击界面左侧…
最新文章