BerDiff: Conditional Bernoulli Diffusion Modelfor Medical Image Segmentation

BerDiff:用于医学图像分割的条件伯努利扩散模型

摘要:

医学图像分割是一项具有挑战性的任务,具有固有的模糊性和高度的不确定性,这主要是由于肿瘤边界不明确和多个似是而非的注释等因素。分割口罩的准确性和多样性对于在临床实践中为放射科医生提供有价值的参考至关重要。虽然现有的扩散模型在各种视觉生成任务中显示出强大的能力,但在分割中处理离散掩码仍然是一个挑战。

为了实现准确多样的医学图像分割掩模,提出了一种新的条件伯努利扩散医学图像分割模型(BerDiff)。我们首先提出使用伯努利噪声作为扩散核来代替高斯噪声来增强扩散模型对二值分割任务的能力,从而得到更精确的分割掩模。其次,通过利用扩散模型的随机特性,我们的BerDiff对初始伯努利噪声和中间潜在变量进行多次随机采样,以产生一系列不同的分割掩模,这可以突出显示感兴趣的突出区域,从而为放射科医生提供有价值的参考。

此外,我们的BerDiff可以有效地从反向扩散的整体轨迹中采样子序列,从而加快了分割过程。在两种不同模式的医学图像分割数据集上的广泛实验结果表明,我们的BerDiff优于其他最近发表的最先进的方法。

我们的研究结果表明,扩散模型可以作为医学图像分割的强大支柱。

1 介绍

医学图像分割在更好的诊断、手术计划和图像引导手术中起着至关重要的作用[8]。医学图像固有的模糊性和高度不确定性给准确分割带来了重大挑战[5],原因包括脑磁共振成像(MRI)图像中肿瘤边界不清晰,肺结节计算机断层扫描(CT)图像中存在多种似是而非的注释。现有的医学图像分割工作通常提供一个单一的,确定性的,最有可能的假设口罩,这可能导致误诊或不理想的治疗。因此,为放射科医生提供准确多样的分割掩模作为有价值的参考[16],在临床实践中至关重要。

最近,扩散模型[10]在各种视觉生成任务中显示出强大的能力[19,20]。然而,如何更好地与离散分割任务相结合需要进一步考虑。虽然许多研究[1,24]将扩散模型与分割任务结合起来并进行了一些修改,但这些方法没有充分考虑到分割任务的离散性,仍然使用高斯噪声作为其扩散核。为了实现准确多样的医学图像分割,提出了一种新的条件伯努利扩散模型(BerDiff)。我们首先提出使用伯努利噪声作为扩散核来代替高斯噪声来增强扩散模型的分割能力,从而得到更精确的分割掩模。此外,通过利用扩散模型的随机特性,我们的BerDiff对初始伯努利噪声和中间潜在变量进行多次随机采样,以产生一系列不同的分割掩模,这可以突出显示感兴趣的突出区域(ROI),这可以作为放射科医生的有价值的参考。此外,基于去噪扩散隐式模型(Denoising diffusion Implicit Models, DDIM)[23]背后的原理,我们的BerDiff可以有效地从反向扩散的总体轨迹中采样子序列,从而加快分割过程。

本工作的贡献总结如下。

1)本文提出了一种新的基于伯努利噪声的条件扩散模型来代替高斯噪声用于离散二值分割任务,实现了准确多样的医学图像分割掩模。

2)我们的BerDiff可以有效地从反向扩散的整体轨迹中采样子序列,从而加快了分割过程。

3)在CT和MRI两种医学图像上的实验结果,特别是LIDC-IDRI和BRATS 2021数据集,表明我们的BerDiff优于其他最先进的方法。

2 方法

在本节中,我们首先描述了问题的定义,然后演示了我们的BerDiff的伯努利正向和多种反向过程,如图1所示。最后,我们提供了培训和抽样程序的概述。

图1所示。我们的BerDiff的伯努利正反过程的说明。

2.1 问题定义

设x∈RH×W×C为输入的医学图像,其空间分辨率为H×W,通道数为C。ground-truth mask表示为y0∈{0,1}H×W,其中0代表背景,1代表ROI。受去噪扩散概率模型(DDPM)和DDIM等基于扩散的模型的启发,我们提出了一种新的条件伯努利扩散模型,该模型可以表示为pθ(y0:T |x):= ʃ pθ(y0:T |x)dy1:T,其中y1,…, yT是与掩码y0大小相同的潜在变量。用于医学二值分割任务中,我们的BerDiff的多样化反向过程从初始伯努利噪声yT ~ B(yT;1 2·1),通过受输入医学图像x约束的中间潜变量进行推进,生成分割掩模,其中1表示大小为H ×W的全一矩阵。

2.2 伯努利正演过程

在上一代相关的扩散模型中,高斯噪声随着时间步长t的增加而逐渐增加。然而,对于分割任务,基底真值掩模由离散值表示。为了解决这个问题,我们的BerDiff使用噪声时间表逐渐增加更多的伯努利噪声β1,…, βT,如图1所示。我们的BerDiff的伯努利前向过程q(y1:T |y0)是一个马尔可夫链,可以表示为:

式中B为伯努利分布,其概率参数为(1 - βt)yt - 1 + βt/2。使用αt =1−βt和¯αt = Ⅱt τ=1ατ的符号,我们可以在任意时间步长t上有效地对yt进行如下采样:

为了确保第2.4节中描述的目标函数易于处理和计算,我们使用采样的伯努利噪声∊ ~ B(?;1−¯αt2·1)将Eq.(3)的yt重新参数化为y0⊕∊,其中⊕表示“exclusive”的逻辑运算。

或(XOR)”。另外,让⊙表示元素积,Norm(·)表示沿通道维度对输入数据进行规范化,然后返回第二个通道。具体的伯努利后验可以表示为:

2.3 多样化的逆向过程

不同的反向过程pθ(y0:T)也可以看作是从伯努利噪声yT ~ B(yT;1/2·1),通过受输入医学图像x约束的中间潜变量,产生不同的分割掩码,如图1所示。我们的BerDiff的具体多样化逆向过程可以表示为:

具体来说,我们利用估计的伯努利噪声。∊ʌ(yt, t, x)通过校准函数FC参数化µʌ(yt, t, x),如下:

其中|·|为绝对值运算。

2.4 详细步骤

在这里,我们概述了算法1和算法2中的训练和抽样过程。在训练阶段,给定图像和掩码数据对{x, y0},我们从均匀分布{1,…T}中采样随机时间步长t,用来对伯努利噪声∊进行采样。

然后我们用∊从q(yt | y0)中抽取yt,得到伯努利后验q(yt−1 | yt, y0)。我们通过估计的伯努利噪声∊ʌ(yt, t, x)通过校准函数FC参数化pθ(yt−1 | yt, x)。

基于以往扩散模型[3]中负对数似然的变分上界,我们采用Kullback-Leibler (KL)散度和二进制交叉熵(BCE)损失对我们的BerDiff进行如下优化:

最后,总体目标函数表示为:

其中λBCE在实验中设为1。

在采样阶段,我们的BerDiff首先对初始潜在变量yT进行采样,然后迭代计算不同t下yT−1的概率参数。在算法2中,我们对潜在变量yT−1提出了DDPM和DDIM两种不同的采样策略。最后,我们的BerDiff能够产生不同的分割掩码。通过对这些掩模取均值,我们可以进一步得到一个显著性分割掩模,以突出ROI,为放射科医生提供有价值的参考。值得注意的是,我们的BerDiff提出了一种新的参数化技术,即校准函数,来估计yt的伯努利噪声,这与以前基于离散状态扩散的模型[3,11,22]不同。

3 实验

3.1 实验设置

数据集与预处理 

本实验使用的数据来自LIDC-IDRI[2,7]和BRATS 2021[4]数据集。LIDC-IDRI包含1,018个肺部CT扫描,由四位放射科医生注释的合理分割掩码。

我们采用了标准的肺部CT扫描预处理流水线和训练验证-测试分割,与之前的工作一样[5,14,21]。BRATS 2021由每个患者的四种不同序列(T1、T2、FlAIR、T1CE) MRI图像组成。

所有3D扫描切片为轴向切片,丢弃底部80片和顶部26片。需要注意的是,我们遵循之前的工作[23],将原来的四种脑肿瘤类型作为一种类型,将多目标分割问题转化为二值分割。我们的训练集包括来自1126名患者扫描的55174张2D图像,测试集包括来自125名患者扫描的3991张2D图像。

最后,将来自LIDC-IDRI和BRAST 2021的图像分别调整为128 × 128和224 × 224。

实现细节 我们使用PyTorch库实现所有方法,并在NVIDIA V100 gpu上训练模型。所有网络都使用批大小为32的AdamW[17]优化器进行训练。最初的

BRATS 2021的学习率为1 × 10−4,LIDC-IDRI的学习率为5 × 10−5。

我们的BerDiff图1中的伯努利噪声估计U-net网络与之前基于扩散的模型[18]相同。对于所有扩散模型,我们采用T = 1000时间步长的线性噪声调度。并采用DDIM的子序列采样策略来加快分割过程。在LIDC-IDRI的小批量训练过程中,我们的BerDiff通过从每个图像的四个带注释的分割蒙版中随机抽取一个来学习不同的专业知识。三个指标用于性能评估,包括广义能量距离(GED),匈牙利匹配交集优于联合(HM-IoU)和骰子系数。我们使用不同数量的分割样本(1、4、8和16)计算GED,使用16个样本计算HM-IoU。

3.2 消融研究

我们首先进行烧蚀实验,以验证不同损失和估算目标的有效性,如表1所示。所有实验都在LIDC-IDRI上进行了21,000次训练迭代。我们首先进行了不同损耗的烧蚀研究,同时估计了前三排的伯努利噪声。我们发现KL散度和BCE损失相结合可以获得最佳性能。在此基础上,对下两行估计目标的选取进行了消融研究。我们观察到估计伯努利噪声比直接估计真值掩模更适合于我们的二值分割任务。这些发现与前人的研究结果一致[3,10]。关于采样策略和采样时间步长的额外消融研究请参见附录A。

在这里,我们用高斯噪声或伯努利噪声对我们的BerDiff进行烧蚀实验,结果如表2所示。对于离散的分割任务,我们发现使用伯努利噪声可以产生良好的效果

图2所示。LIDC-IDRI随机选取的两个肺结节的不同分割掩膜及相应的显著性掩膜。Xi0和xight分别是第i个生成的和ground-truth分割掩码。显著性掩码是多种分割掩码的均值。

训练迭代是有限的(例如21,000次迭代),当训练迭代足够时(例如86,500次迭代),甚至优于使用高斯噪声。

我们还在附录b中提供了基于伯努利和高斯的扩散模型在训练迭代上的更详细的性能比较。此外,我们在附录C中提供了一个玩具示例来证明伯努利扩散优于高斯扩散。

3.3 与其他先进方法的比较

在LIDC-IDRI上的结果  这里,我们在表3中给出了LIDC-IDRI的定量比较结果,发现我们的BerDiff在离散分割任务中表现良好。概率U-net (Prob.U-net),层次问题。U-net (Hprob.U-net)和Joint prob.net。U-net (JPro.U-net)使用条件变分自编码器(cV AE)来完成分割任务。校准Adversar -

图3所示。BRATS 2021中随机选取的四张MRI图像的分割掩码。这里介绍的基于扩散的模型(SegDiff和我们的)的分割蒙版是显著性分割蒙版。

神经网络细化(CAR)采用生成对抗网络(GAN)来细化分割。PixelSeg是基于自回归模型,而SegDiff和MedSegDiff是基于扩散的模型。我们有以下两个观察结果:

1)对于离散分割任务,基于扩散的方法比基于VAE、GAN和自回归模型的传统方法具有显著的优势;

2)我们的BerDiff优于其他使用高斯噪声作为扩散核的基于扩散的模型。同时,我们给出了对比分割结果,如图2所示。与其他模型相比,我们的BerDiff可以有效地学习不同的专业知识,从而获得更多样化和准确的分割掩码。特别是对于可能产生歧义的小结节,例如左侧的肺结节,我们的BerDiff方法产生的分割掩模更符合ground-truth掩模。

BRATS 2021的结果  

在这里,我们分别在表4和图3中给出了BRATS 2021的定量和定性比较结果。

我们将我们的BerDiff与其他模型进行了比较分析,如nnU-net、基于变压器的模型(如TransU-net和Swin UNETR)以及基于扩散的方法(如SegDiff)。首先,我们发现与传统的U-net和基于变压器的方法相比,基于扩散的方法表现出优越的性能。此外,与我们的噪声估计网络具有相同架构的U-net所取得的高性能,突出了基于扩散模型的骨干设计的有效性。此外,我们提出的BerDiff优于其他使用高斯噪声作为扩散核的基于扩散的模型。最后,从图3中,我们发现我们的BerDiff片段在人眼难以识别的部分上更加准确,比如第3行的肿瘤。同时,我们还可以生成多种似是而非的分割掩码,从而得到显著性分割掩码。我们注意到,其中一些掩码可能是假阳性,如第一行所示,但由于显着性较低,它们可以被过滤掉。请参阅附录D,以获得由我们的BerDiff生成的不同分割掩码的更多示例。

4 结论

我们首先提出使用伯努利噪声作为扩散核来增强扩散模型对二值分割任务的能力,实现准确多样的医学图像分割结果。与其他基于扩散的模型相比,我们的BerDiff只关注二值分割任务,并且在迭代采样过程中花费大量时间;例如,我们的BerDiff对一幅医学图像的分割时间为0.4s,是传统U-net的10倍。在未来,我们将把我们的BerDiff扩展到多目标分割问题,并实施额外的策略来加快分割过程。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/415210.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【UVM_Introduction Factory_2024.02.28】

Introduction 通用验证方法学UVM(2014年1.2版本延续至今) 作用: 降低验证工程复杂度,保证验证可靠性,提升验证效率 提供一套标准的类库,减轻环境构建的负担,更多的投入制定验证计划和创建测试场…

springboot228高校教师电子名片系统

高校教师电子名片系统的设计与实现 摘 要 传统信息的管理大部分依赖于管理人员的手工登记与管理,然而,随着近些年信息技术的迅猛发展,让许多比较老套的信息管理模式进行了更新迭代,名片信息因为其管理内容繁杂,管理数…

【数据结构】数组

第一章、为什么数组的下标一般从0开始编号 提到数组,读者肯定不陌生,甚至还会很自信地说,数组很简单。编程语言中一般会有数组这种数据类型。不过,它不仅是编程语言中的一种数据类型,还是基础的数据结构。尽管数组看起…

代码随想录算法训练营29期|day64 任务以及具体安排

第十章 单调栈part03 有了之前单调栈的铺垫&#xff0c;这道题目就不难了。 84.柱状图中最大的矩形class Solution {int largestRectangleArea(int[] heights) {Stack<Integer> st new Stack<Integer>();// 数组扩容&#xff0c;在头和尾各加入一个元素int [] ne…

半小时到秒级,京东零售定时任务优化怎么做的?

导言&#xff1a; 京东零售技术团队通过真实线上案例总结了针对海量数据批处理任务的一些通用优化方法&#xff0c;除了供大家借鉴参考之外&#xff0c;也更希望通过这篇文章呼吁大家在平时开发程序时能够更加注意程序的性能和所消耗的资源&#xff0c;避免在流量突增时给系统…

【web APIs】3、(学习笔记)有案例!

提示&#xff1a;文章写完后&#xff0c;目录可以自动生成&#xff0c;如何生成可参考右边的帮助文档 文章目录 前言一、概念其他事件页面加载事件元素滚动事件页面尺寸事件 元素尺寸与位置 二、案例举例电梯导航 前言 掌握阻止事件冒泡的方法理解事件委托的实现原理 一、概念…

【MATLAB源码-第151期】基于matlab的开普勒化算法(KOA)无人机三维路径规划,输出做短路径图和适应度曲线。

操作环境&#xff1a; MATLAB 2022a 1、算法描述 开普勒优化算法&#xff08;Kepler Optimization Algorithm, KOA&#xff09;是一个虚构的、灵感来自天文学的优化算法&#xff0c;它借鉴了开普勒行星运动定律的概念来设计。在这个构想中&#xff0c;算法模仿行星围绕太阳的…

免费网站搭建

免费网站搭建 一.领取一个免费域名和SSL证书&#xff0c;和CDN 特点&#xff1a;支持Cloudflare CDN Cloudflare是全球知名的CDN提供商&#xff0c;如果你不想暴露你的源站&#xff0c;又想使用我们的二级域名&#xff0c;不需要前往Cloudflare添加域名&#xff0c;修改NS记录…

特斯拉掀起「端到端」风暴,自动驾驶持续开卷

作者 |三少爷 编辑 |祥威 最近&#xff0c;特斯拉向在美用户推送了版本号为V12.1.2 Beta的端到端FSD&#xff0c;版本推送后&#xff0c;海外的特斯拉车主和视频博主上传了一些测试视频&#xff0c;测评视频本身没有太多好说的&#xff0c;真正值得关注的是「端到端」。 自马…

C++ 之LeetCode刷题记录(三十五)

&#x1f604;&#x1f60a;&#x1f606;&#x1f603;&#x1f604;&#x1f60a;&#x1f606;&#x1f603; 开始cpp刷题之旅。 目标&#xff1a;执行用时击败90%以上使用 C 的用户。 15. 三数之和 给你一个整数数组 nums &#xff0c;判断是否存在三元组 [nums[i], num…

(2024,Sora 逆向工程,DiT,LVM 技术综述)Sora:大视觉模型的背景、技术、局限性和机遇回顾

Sora: A Review on Background, Technology, Limitations, and Opportunities of Large Vision Models 公和众和号&#xff1a;EDPJ&#xff08;进 Q 交流群&#xff1a;922230617 或加 VX&#xff1a;CV_EDPJ 进 V 交流群&#xff09; 目录 0. 摘要 1. 简介 2. 背景 2.1…

「算法」前缀和

前缀和主要解决求数组中某段区间元素和的问题&#xff0c;使用前缀和解决问题的步骤如下: 预处理一个前缀和数组使用这个数组 一维前缀和 现在有一个一维数组nums 预处理前缀和数组 定义一个数组 dp[]&#xff0c;dp[i]表示 nums 中 [0,i-1] 区间的元素和&#xff0c;那我们…

《互联网的世界》第二讲-最短路径优先

昨天讲 dns 时讲过&#xff0c;“你问一个当地人最近的厕所在哪&#xff0c;路人给你一个地址…”&#xff0c;可是只有地址还不够&#xff0c;如何到达那里呢&#xff1f;这是本节的内容。 自然的方式是&#xff0c;一边走一边问&#xff0c;根据路人的指示继续一边走一边问…

Cap0:TensorRT环境搭建

文章目录 1、安装TensorRT1.1、下载TensorRT压缩包1.2、配置环境变量 2、测试2.1、测试源码2.2、编译源码 1、安装TensorRT TensorRT是针对NVIDIA显卡设备的加速方案&#xff0c;你要使用TensorRT则证明你有一定的深度学习基础&#xff0c;那么在你的Ubuntu上配置好显卡驱动、…

Vue.js实战:构建一个简单的学生管理系统

摘要&#xff1a; 本文将引导你使用Vue.js框架来构建一个完整的学生管理系统。我们将从环境搭建开始&#xff0c;逐步介绍Vue的核心概念、组件创建、数据管理、事件处理、路由配置以及项目构建等关键步骤。通过实际操作&#xff0c;你将能够掌握Vue.js的基础知识&#xff0c;并…

基础!!!吴恩达deeplearning.ai:多标签分类与高级优化方法

以下内容有任何不理解可以翻看我之前的博客哦&#xff1a;吴恩达deeplearning.ai专栏 文章目录 智能驾驶高级优化方法梯度下降算法回顾 Adam算法(Adaptive Moment estimation)模型部分编译部分拟合部分 之前我们已经学习了多分类问题的神经网络的搭建。而有一种特殊的分类问题…

【亚马逊云新春特辑③】构生成式 AI 文生图工具之借助ControlNet进行AI绘画创作【使用OpenPose优化人物二维码】

文章目录 2.1 使用OpenPose优化人物二维码1&#xff09;数据及环境准备2&#xff09;导入骨架数据并启用OpenPose控制单元3&#xff09;导入二维码并生成美化后的二维码图片 2.1 使用OpenPose优化人物二维码 在上一节体验到了使用ControlNet并结合QR Code生成二维码&#xff0…

雾锁王国服务器官方配置要求说明

雾锁王国/Enshrouded服务器CPU内存配置如何选择&#xff1f;阿里云服务器网aliyunfuwuqi.com建议选择8核32G配置&#xff0c;支持4人玩家畅玩&#xff0c;自带10M公网带宽&#xff0c;1个月90元&#xff0c;3个月271元&#xff0c;幻兽帕鲁服务器申请页面 https://t.aliyun.com…

自动从金蝶取数,做BI报表的工具,快来长见识!

技术越进步&#xff0c;分析工具越智能&#xff0c;如今做数据分析、数据可视化&#xff0c;不仅能连接金蝶系统&#xff0c;更能直接从金蝶ERP中取数做分析&#xff0c;自动输出BI数据可视化分析报表。这就是奥威-金蝶BI方案。 是骡子是马&#xff0c;牵出来遛遛就知道&#…

STM32标准库开发—硬件SPI外设

SPI外设简介 SPI1与SPI2所挂载的总线位置不一样&#xff0c;所以时钟频率也不一样&#xff0c;SPI2挂载在APB1时钟频率为36MHZ是SPI1的一半 I2S是一种音频传输协议&#xff0c;适用于STM32大容量产品 一般来说串口发送数据时是低位先行&#xff0c;SPI通信是高位先行 SPI框图 发…
最新文章