DoubleU-Net:一种用于医学图像分割的深度卷积神经网络

DoubleU-Net:一种用于医学图像分割的深度卷积神经网络

  • 摘要
  • 引言
  • 相关工作
  • 方法

DoubleU-Net A Deep Convolutional Neural Network for Medical Image Segmentation–2020

摘要

语义图像分割是将图像中的每个像素标记为相应的类的过程。基于编码器-解码器的方法,如U-Net及其变体,是解决医学图像分割任务的流行策略。为了提高U-Net在各种分割任务上的性能,我们提出了一种名为DoubleU-Net的新架构,它是两个U-Net架构相互堆叠的组合。第一个U-Net使用预训练的VGG-19作为编码器,它已经从ImageNet中学习了特征,可以轻松地转移到另一个任务中。为了有效地捕获更多的语义信息,我们在底部添加了另一个U-Net。我们还采用Atrous空间金字塔池(ASPP)来捕获网络中的上下文信息。我们使用四个医学分割数据集对DoubleU-Net进行了评估,涵盖了各种成像方式,如结肠镜检查、皮肤镜检查和显微镜检查。在MICCAI 2015分割挑战、CVC ClinicDB、2018 Data Science Bowl挑战和病变边界分割数据集上的实验表明,DoubleU-Net优于U-Net和基线模型。此外,DoubleU-Net生成更准确的分割模板,特别是在CVCClinicDB和MICCAI 2015分割挑战数据集的情况下,这些数据集具有挑战性的图像,例如较小和平坦的息肉。这些结果显示了对现有U-Net模型的改进。在各种医学图像分割数据集上产生的令人鼓舞的结果表明,DoubleU-Net可以用作医学图像分割和跨数据集评估测试的强大基线,以衡量深度学习(DL)模型的通用性。

引言

医学图像分割是对医学图像中感兴趣对象的每个像素进行标记的任务。它通常是临床应用的关键任务,从用于病变检测的计算机辅助诊断(CADx)到治疗计划和指导[1]。医学图像分割可以帮助临床医生专注于疾病的特定区域,并提取详细信息以进行更准确的诊断。与医学图像分割相关的关键挑战是大量注释的不可用,缺乏用于训练的高质量标记图像[2],图像质量低,缺乏标准分割协议,以及患者之间的图像差异很大[3]。分割精度和不确定性的量化对于估计其他应用的性能至关重要[1]。这表明需要一个自动的,可推广的,高效的语义图像分割方法。
卷积神经网络(CNN)已显示出自动医学图像分割的最新性能[4]。对于语义分割任务,早期的深度学习(DL)架构之一是全卷积网络(FCN),它是端到端训练的,用于逐像素预测。U-Net [5]是另一种流行的图像分割架构,经过端到端的训练,用于逐像素预测。U-Net架构由分析路径和合成路径两部分组成,在分析路径中学习深度特征,在合成路径中基于学习的特征进行分割。此外,U-Net使用跳过连接操作。跳过连接允许将密集特征图从分析路径传播到合成部分中的对应层。通过这种方式,空间信息被应用于更深层,这显著地产生更准确的输出分割图。因此,向U-Net添加更多层将允许网络学习更多代表性特征,从而获得更好的输出分割掩码。

U-Net架构由分析路径和合成路径两部分组成,在分析路径中学习深度特征,在合成路径中基于学习的特征
进行分割。
可以这么说吗???
----那我如果把不同层级的结果都softmax一下,然后再给它上下采样或者怎样整合一下嘞???

一般化,即,模型在独立数据集中执行的能力,以及鲁棒性,即,模型在具有挑战性的图像上执行的能力是开发用于临床试验的人工智能(AI)系统的关键[6]。因此,必须设计一个强大的架构,在不同的生物医学应用中是强大的和可推广的。预训练的ImageNet [7]模型显着提高了CNN架构的性能。在ImageNet上训练的这种模型的一个例子是VGG 19 [8]。受U-Net及其变体在医学图像分割方面的成功启发,我们提出了一种在网络编码器部分使用修改后的U-Net和VGG-19的架构。因为我们在网络中使用两个UNet架构,所以我们将该架构称为DoubleU-Net。使用VGG网络的主要原因是:(1)与其他预训练模型相比,VGG-19是一个轻量级模型,(2)VGG-19的架构类似于U-Net,易于与U-Net连接,(3)它将允许更深的网络产生更好的输出分割掩码。因此,我们的目标是通过启用这种架构变化来提高网络的整体分割性能。
本文的主要贡献是:

  1. 提出了一种新的语义图像分割体系结构,DoubleU-Net。所提出的架构使用两个U-Net架构的顺序,两个编码器和两个解码器。网络中使用的第一个编码器是预训练的VGG-19 [8],它是在ImageNet [7]上训练的。此外,我们使用Atrous空间金字塔池(ASPP)[9]。架构的其余部分是从头开始构建的。
  2. 在多个数据集上的实验是显示所提出的算法优于其他算法的先决条件。在这方面,我们已经在四个不同的医学成像数据集上进行了实验,两个不同的数据集来自结肠镜检查,一个来自皮肤镜检查,一个来自显微镜检查。与自动息肉检测数据集、CVC-ClinicDB数据集、ISIC-2018的病变边界分割挑战和2018 Data Science Bowl挑战数据集上的2015 MICCAI子挑战相比,DoubleU-Net显示出更好的分割性能。
  3. 在四个数据集上对DoubleU-Net进行的广泛评估显示,与U-Net相比,DoubleU-Net有了显著的改进。因此,DoubleU-Net可以作为医学图像分割任务的新基线。

相关工作

在不同的CNN架构中,像FCN [10]及其扩展U-Net [5]这样的编码器-解码器网络在2D图像的语义分割方法中非常流行。Badrinarayan等人。[11]提出了一种用于语义像素分割的深度全CNN,其参数显著减少,并产生良好的分割图。Yu等人[12]提出了一种新的卷积网络模块,特别针对密集预测问题。所提出的模块使用扩张卷积系统地聚合多尺度上下文信息,所提出的上下文模块提高了最先进的语义图像分割系统的准确性。
Chen等人。[13]提出DeepLab来解决分割问题。后来,DeeplabV 3 [9]在没有DenseCRF后处理的情况下,比之前的DeepLab版本有了显著的改进。DeepLabV 3架构使用的合成路径包含的卷积层数量较少,与FCN和UNet的合成路径不同。DeepLabV 3使用类似于U-Net架构的分析路径和合成路径之间的跳过连接。Zhao等人[14]提出了用于复杂场景理解的有效场景解析网络,其中全局金字塔特征提供了捕获额外上下文信息的机会。Zhang等人[15]提出了Deep Residual U-Net,它使用残差连接更好地输出分割图。Chen等人。[16]提出了用于医学图像分割的Dense-Res-Inception Net(DRINET),并将其结果与FCN,U-Net和ResUNet进行了比较。Ibtehaz等人。[17]修改了UNet,并提出了一种改进的MultiResUNet架构用于医学图像分割,他们在各种医学图像分割数据集上将其结果与U-Net进行了比较,并显示出比U-Net更上级的准确性。
Jha等人。[18]提出了ResUNet++,这是标准ResUNet的增强版本,通过将挤压和激发块,ASPP和注意力块等附加层集成到网络中。与Kvasir-SEG [2]和CVC-ClinicDB [19]数据集上的U-Net和ResUNet相比,所提出的架构使用骰子损失作为损失函数,并产生改进的输出分割图。Zhou等人。[20]提出了UNet++,这是一种用于语义和实例分割任务的神经网络架构。他们通过减轻未知的网络深度,重新设计跳过连接,并设计架构的修剪方案来提高UNet++的性能。
从上述相关工作中,我们可以观察到,人们已经做出了大量努力来开发用于自然和医学图像分割的深度CNN架构。最近,更多的工作集中在开发可推广的模型上,这就是为什么大多数研究人员在不同的数据集上测试他们的算法[17],[18],[20]。现在,自然成像[13]和医学成像[17],[18],[20]的准确度都很高。然而,医疗领域的AI仍然是一个新兴领域。医疗领域的一个重大挑战是缺乏测试数据集。此外,获得的数据集往往是不平衡的。在某种程度上,我们可以说,在自然图像的情况下,性能是可以接受的。在医学成像中,有许多具有挑战性的图像(例如,结肠镜检查中的扁平息肉),这些图像通常在结肠镜检查期间被遗漏,如果不进行早期检测,则可能发展为癌症。因此,需要一种更精确的医学图像分割方法来处理具有挑战性的图像。为了满足这一需求,我们提出了DoubleU-Net架构,该架构可以使用具有挑战性的图像生成高效的输出分割掩码。

方法

在这里插入图片描述

图1显示了建议的架构的概述。如图所示,DoubleU-Net以VGG-19作为编码器子网络开始,然后是解码器子网络。
在第一个网络(网络1)中,DoubleU-Net与U-Net的区别在于使用黄色标记的VGG-19、蓝色标记的ASPP和浅绿
色标记的解码器块。挤压和激励块[21]用于NETWORK 1的编码器以及NETWORK 1和NETWORK 2的解码器块。
在NETWORK 1的输出与同一网络的输入之间执行逐元素乘法。第二个网络(网络2)中DoubleU-Net和U-Net之
间的区别仅在于使用了ASPP和挤压和激励块。所有其他组件保持不变。

拟议的DoubleU-Net架构框图
在NETWORK 1中,输入图像被馈送到修改的U-Net,其生成预测掩码(Output 1)。然后,我们将输入图像与生成的掩码(Output 1)相乘,它作为第二个修改后的U-Net的输入,生成另一个掩码(Output 2)。最后,我们将两个掩码(Output 1和Output 2)连接起来,以查看中间掩码(Output 1)和最终预测掩码(Output 2)之间的定性差异。
我们假设从NETWORK 1产生的输出特征图仍然可以通过再次获取输入图像及其相应的掩码来改进,并且与Output 2连接将产生比前一个更好的分割掩码。这是在所提出的架构中使用两个U-Net架构的主要动机。在所提出的网络中的挤压和激励块减少了冗余信息,并通过最相关的信息。ASPP是现代分割架构的热门选择,因为它有助于提取高分辨率特征图,从而获得上级性能[18]。
A. Encoder Explanation—A.编码器说明
DoubleU-Net中的第一个编码器(编码器1)使用预训练的VGG-19,而第二个编码器(编码器2)则是从头开始构建的。每个编码器试图对输入图像中包含的信息进行编码。encoder 2中的每个编码器块执行两个3×3卷积运算,每个卷积运算之后是批量归一化。批量归一化减少了内部协变移位,也使模型正则化。应用整流线性单元(ReLU)激活函数,其将非线性引入模型中。这之后是一个挤压和激励块,这提高了特征图的质量。之后,使用2 × 2窗口和步幅2执行最大池化,以减少特征图的空间维度。
B. Decoder ExplanationB。解码器说明如图1所示,我们在整个网络中使用两个解码器,与原始U-Net相比,解码器有很小的修改。解码器中的每个块对输入特征执行2 × 2双线性上采样,这使输入特征图的维度加倍。现在,我们将适当的跳过连接特征映射从编码器连接到输出特征映射。在第一个解码器中,我们只使用来自第一个编码器的跳过连接,但在第二个解码器中,我们使用来自两个编码器的跳过连接,这保持了空间分辨率并提高了输出特征图的质量。在连接之后,我们再次执行两个3 × 3卷积运算,每个运算之后都是批量归一化,然后是ReLU激活函数。之后,我们使用挤压和激发块。最后,我们应用了一个具有sigmoid激活函数的卷积层,该函数用于生成相应修改后的U-Net的掩码。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/497129.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

如何在Win10使用IIS服务搭建WebDAV网站并实现无公网IP访问内网文件内容

文章目录 前言1. 安装IIS必要WebDav组件2. 客户端测试3. 使用cpolar内网穿透,将WebDav服务暴露在公网3.1 安装cpolar内网穿透3.2 配置WebDav公网访问地址 4. 映射本地盘符访问 前言 在Windows上如何搭建WebDav,并且结合cpolar的内网穿透工具实现在公网访…

银行监管报送系统介绍(十二):非居民金融账户涉税信息报送

国家税务总局、财政部、中国人民银行、中国银行业监督管理委员会、中国证券监督管理委员会、国家金融监督管理总局2017年5月9日发布、2017年7月1日起施行的《非居民金融账户涉税信息尽职调查管理办法》。 一、《管理办法》出台的背景是什么?   受二十国集团&…

软件设计师24--概念设计阶段

软件设计师24--概念设计阶段 考点1:概念设计过程考点2:E-R图属性E-R模型-联系类型判断例题:E-R模型-联系类型判断扩充的E-R模型 考点1:概念设计过程 需求分析 --> 抽象数据 --> 设计局部ER模型 --> 合并局部模型消除冲突…

接口自动化测试要做什么?8个步骤讲的明明白白

🍅 视频学习:文末有免费的配套视频可观看 🍅 点击文末小卡片,免费获取软件测试全套资料,资料在手,涨薪更快 先了解下接口测试流程: 1、需求分析 2、Api文档分析与评审 3、测试计划编写 4、用例设…

2024年2月吸尘器行业线上电商(京东天猫淘宝)综合排行榜

鲸参谋监测的线上电商平台(淘宝天猫京东)2月吸尘器行业销售数据公开。 根据鲸参谋电商数据平台显示,吸尘器行业2月销量累计约53万件,环比上个月下滑29%,同比去年下滑19%;销售额累计约4亿,环比上…

原生js实现循环滚动效果

原生js实现如下图循环滚动效果 核心代码 <div class"scroll"><div class"blist" id"scrollContainer"><div class"bitem"></div>......<div class"bitem"></div></div> </di…

ES学习日记(一)-------单节点安装启动

基于ES7.4.1编写,其实一开始用的最新的8.1,但是问题太多了!!!!不稳定,降到7.4 下载好的安装包上传到服务器或虚拟机,创建ES目录,命令mkdir -p /路径xxxx 复制安装包到指定路径并解压: tar zxvf elasticsearch-8.1.0-linux-x86_64.tar.gz -C /usr/local/es/ 进入bin目录安装,命…

【操作系统复习之路】操作系统概述(复习的同学有福啦)

长话短说&#xff0c;就记下笔记&#xff0c;期待期末90&#xff0c;随便希望能帮助到有需要的同学。 目录 一、操作系统的目标和作用 二、操作系统的发展过程 2.1 无OS 2.2 有OS 【1】批处理系统 【2】分时系统 【3】实时操作系统 【4】三种基本操作系统的比较&#…

类的定义与实例化

一.类的定义 1.1 格式 定义类的一般格式如下&#xff1a; class 类名{ public:公有成员列表; protected:保护成员列表; private:私有成员列表; }; 构成元素&#xff1a; &#xff08;1&#xff09;类头&#xff08;class head&#xff09; “class 类名”称为类头。 &…

大视频上传断点续传解决方案

版本&#xff1a;6.5.40 代码&#xff1a;up6-jsp-springboot: Web大文件上传-jsp-springboot示例 - Gitee.com nosql示例 nosql示例不需要进行任何配置&#xff0c;可以直接访问测试。 SQL示例 1.创建数据库 2.配置数据库连接 3.自动下载maven依赖 4.启动项目 启动成功 6.访…

开源 | 电动汽车充换电解决方案,从智能硬件到软件系统,全部自主研发

文章目录 一、产品功能部分截图1.手机端&#xff08;小程序、安卓、ios&#xff09;2.PC端 二、小程序体验账号以及PC后台体验账号1.小程序体验账号2.PC后台体验账号关注公众号获取最新资讯 三、产品简介&#xff1f;1. 充电桩云平台&#xff08;含硬件充电桩&#xff09;&…

VTK——自定义二维图像涂抹Widget(支持任意值涂抹),擦除,恢复 vtkCustomPaintWidget

通过鼠标控制 涂抹区域&#xff0c;可以进行&#xff0c;后退&#xff0c;可以进行二维标注&#xff0c;也可以进行回退&#xff0c;也可以任意值涂抹。 vtkCustomPaintWidget 1.标注&#xff1a; 2.擦除 视频&#xff1a; 2D标注 vtkPaint VTK 2D 标注 描绘 2D 擦除&#x…

蓝桥杯-卡片换位

solution 有一个测试点没有空格&#xff0c;要特别处理&#xff0c;否则会有一个测试点运行错误&#xff01; 还有输入数据的规模在变&#xff0c;小心顺手敲错了边界条件 #include<iostream> #include<string> #include<queue> #include<map> #incl…

picgo + 腾讯云 cos 图床搭建

文章目录 0.背景&简介1.注册腾讯云并创建 COS 存储桶2.获取 API 密钥3.安装并配置 PicGo4.配置typora 0.背景&简介 背景: 文档笔记有图片但存储在本地, 想发送给别人需要连同图片目录一起绑定发送比较麻烦 这里使用对象存储 CDN搭建图床 简介: PicGo 是一款开源的图片…

为什么Python不适合写游戏?

知乎上有热门个问题&#xff1a;Python 能写游戏吗&#xff1f;有没有什么开源项目&#xff1f; Python可以开发游戏&#xff0c;但不是好的选择 Python作为脚本语言&#xff0c;一般很少用来开发游戏&#xff0c;但也有不少大型游戏有Python的身影&#xff0c;比如&#xff1…

使用AI创造诗词歌曲

大家好我是在看&#xff0c;记录普通人学习探索AI之路。 在前面的几讲&#xff0c;我们介绍了AI的使用方法&#xff0c;今天我们正式进入实操环节&#xff0c;讲一讲用如何用AI来创作诗歌。 之前我们在讲AI使用的时候&#xff0c;曾经介绍过一种技巧叫做"种子词提示”。…

快速创建zookeeper集群

先说明&#xff0c;zookeeper集群的3个节点都放在同一个虚拟机&#xff08;穷&#xff09;&#xff0c;所以搭建是一个伪集群&#xff0c;因为一个服务器挂机&#xff0c;所有节点都会停止。工作实际情况安装到三个服务器&#xff0c;并修改节点配置的ip地址即可&#xff08;红…

虚拟机-从头配置Ubuntu18.04(包括anaconda,cuda,cudnn,pycharm,ros,vscode)

最好先安装anaconda后cuda和cudnn&#xff0c;因为配置环境的时候可能conda会覆盖cuda的路径&#xff08;不确定这种说法对不对&#xff0c;这里只是给大家的建议&#xff09; 准备工作&#xff1a; 1.Ubuntu18.04&#xff0c;x86_64&#xff0c;amd64 虚拟机下载和虚拟机Ubu…

Discord账号多开如何做?有什么办法可以同时在线?

Discord 是一款免费的语音和文本聊天应用程序。它是一个游戏聊天应用程序和社区&#xff0c;最初是游戏的语音和IM服务&#xff0c;然后转向直播&#xff0c;然后是游戏商店的社区平台。它成为游戏玩家在游戏中交流和协作的首选工具。下面将为你介绍如何同时使用多个discord账号…

XPath攻略:从入门到精通,告别查找困难!

简介 XPath 是一种用于在 XML 文档中检索信息的语言。它通过路径表达式导航 XML 文档&#xff0c;广泛应用于各种场景。XPath 的灵活性和强大功能使其成为在 XML 结构中准确定位和提取数据的重要工具。 XPath 使用场景 Web 自动化测试&#xff1a; XPath 在 Web 自动化测试中…
最新文章