文献速递:基于SAM的医学图像分割---nnSAM:即插即用的分割任何东西模型 模型提升了nnUNet性能

Title 

题目

nnSAM: Plug-and-play Segment Anything Model Improves nnUNet Performance

nnSAM:即插即用的分割任何东西模型 模型提升了nnUNet性能

01

文献速递介绍

在现代临床工作流中,医学图像的高效准确分割对于疾病诊断和预后、治疗计划和监控以及治疗结果跟踪至关重要。传统上,医学图像分割是一个非常耗时和劳动密集的任务。深度学习自动分割技术的出现显著减少了放射科医生和放射肿瘤学家所需的时间和努力。在为生物医学图像分割设计的众多深度学习架构中,U-Net以其有效和高效捕获全局和局部特征的能力而脱颖而出,以获得更好的分割结果。基于U-Net骨架,大量研究开发了针对不同任务的各种修改架构。例如,TransUNet集成了U-Net和Transformers的优势,为医学图像分割定义了一个新的基准。通过利用Transformers的全局上下文理解和U-Net的精确定位能力,TransUNet能够捕获长距离依赖性,同时保持对局部结构的分割精度。另一个例子是UNet++,旨在弥合编码器和解码器特征图之间的语义差距。它结合了深度监督的编解码器网络和嵌套的密集跳跃路径,以提高分割精度。另一个网络,SwinUNet引入了另一种基于Transformer的方法来进行医学图像分割,利用U型编解码器架构和跳跃连接,增强了局部-全局语义特征学习。该模型表现出了优于传统基于卷积方法和混合Transformer-卷积技术的卓越性能。然而,许多分割工作仍需要大量人力进行架构修改和超参数调整,以适应不同的应用或数据集。为了应对这一挑战,提出了nnUNet框架。nnUNet框架采取了一种独特的方法,即“无新网络”,不提出新的网络架构。相反,它重新关注方法学、架构搜索和数据预处理步骤,以获得最佳性能。nnUNet策略证明,通过适当的预处理和后处理组合,即使是基本的网络架构也可以在广泛的医学分割任务中实现最先进的性能。

Abstract

摘要

The recent developments of foundation models in computer vision, especially the Segment Anything Model (SAM), allow scalable and domain-agnostic image segmentation to serve as a general-purpose

segmentation tool. In parallel, the field of medical image segmentation has benefited significantly from specialized neural networks like the nnUNet, which is trained on domain-specific datasets and can automatically con figure the network to tailor to specific segmentation challenges. To com bine the advantages of foundation models and domain-specific models, we present nnSAM, which synergistically integrates the SAM model with the nnUNet model to achieve more accurate and robust medical im age segmentation. The nnSAM model leverages the powerful and ro bust feature extraction capabilities of SAM, while harnessing the auto matic configuration capabilities of nnUNet to promote dataset-tailored learning. Our comprehensive evaluation of nnSAM model on different sizes of training samples shows that it allows few-shot learning, which is highly relevant for medical image segmentation where high-quality, annotated data can be scarce and costly to obtain. By melding the strengths of both its predecessors, nnSAM positions itself as a potential new benchmark in medical image segmentation, offering a tool that com bines broad applicability with specialized efficiency. The code is available at https://github.com/Kent0n-Li/Medical-Image-Segmentation.

近期,在计算机视觉领域的基础模型发展,尤其是“分割任何东西模型”(SAM),允许可扩展且领域无关的图像分割,成为一种通用的分割工具。与此同时,医学图像分割领域显著受益于专门的神经网络,如nnUNet,该网络针对特定领域的数据集进行训练,并能自动配置网络,以适应特定的分割挑战。为了结合基础模型和特定领域模型的优势,我们提出了nnSAM,它将SAM模型与nnUNet模型协同整合,以实现更准确、更稳健的医学图像分割。nnSAM模型利用了SAM的强大和稳健的特征提取能力,同时利用nnUNet的自动配置能力,促进了针对特定数据集的学习。我们对nnSAM模型在不同规模训练样本上的综合评估显示,它允许少量样本学习,这对于医学图像分割来说非常相关,因为高质量、标注数据可能稀缺且成本高昂。通过融合其前身的优势,nnSAM将自身定位为医学图像分割中潜在的新基准,提供了一种结合广泛适用性与专业效率的工具。代码可在 https://github.com/Kent0n-Li/Medical-Image-Segmentation 获取。

METHOD

方法

2.1 Architecture Overview

The architecture of the proposed nnSAM framework is depicted in Fig. 1. The model is designed to combine the strengths of nnUNet [8] and SAM [9]. Specif ically, nnSAM consists of two parallel encoders: the nnUNet encoder and the SAM encoder. The SAM encoder is a pre-trained Vision Transformer (ViT) . The embeddings from both encoders are concatenated and subsequently fed into nnUNet’s decoder to output the final segmentation map. Furthermore, the SAM encoder is used as a plug-and-play plugin whose parameters are frozen during

training. Correspondingly, only the weightings of the encoder and decoder of thennUNet are updated during the training.

2.1 架构概览

所提出的nnSAM框架的架构如图 1 所示。该模型旨在结合nnUNet [8]和SAM [9]的优势。具体来说,nnSAM包含两个并行的编码器:nnUNet编码器和SAM编码器。SAM编码器是一个预训练的视觉Transformer(ViT)[13]。两个编码器的嵌入被串联起来,随后输入到nnUNet的解码器中,以输出最终的分割图。此外,SAM编码器被用作即插即用的插件,其参数在训练期间被冻新。

CONCLUSION

结论

We introduce nnSAM, a novel, few-shot learning solution for medical image seg mentation that melds the strengths of the Segment Anything Model (SAM) and nnUNet. Our extensive evaluation across different numbers of 2D training sam ples sets a potential new benchmark in medical image segmentation, especially in scenarios where training data is scarce. The results also highlight the robust ness and superior segmentation performance of nnSAM, making it a promising tool for future research and practical applications in medical imaging.

我们介绍了nnSAM,这是一个新颖的少样本学习解决方案,用于医学图像分割,它融合了Segment Anything Model (SAM)和nnUNet的优势。我们通过不同数量的2D训练样本进行的广泛评估,为医学图像分割设置了一个潜在的新基准,特别是在训练数据稀缺的情况下。结果还突出了nnSAM的鲁棒性和卓越的分割性能,使其成为未来研究和医学成像实际应用中的一个有前景的工具。

Fig

图片

Fig. 1. The architecture of nnSAM, which integrates nnUNet’s encoder with the pre trained SAM encoder. The correspondingly concatenated embeddings are input into nnUNet’s decoder to output the final segmentation. A cardiac sub-structure segmenta tion example is presented. (LV: left ventricle; RV: right ventricle; LA: left atrium; RA: right atrium; Myo: myocardium of LV)

图 1. nnSAM的架构,它将nnUNet的编码器与预训练的SAM编码器整合在一起。相应连接的嵌入作为输入输入到nnUNet的解码器中,以输出最终的分割结果。这里展示了一个心脏亚结构分割的例子。(LV:左心室;RV:右心室;LA:左心房;RA:右心房;Myo:左心室的心肌)

图片

Fig. 2. Example 1 of segmentation visualization results for different methods on different numbers of training samples.

图 2. 不同训练样本数量下,不同方法的分割可视化结果示例1。

图片

Fig. 3. Example 2 of segmentation visualization results for different methods on different numbers of training samples.

图 3. 不同训练样本数量下,不同方法的分割可视化结果示例2

Table 

图片

Table 1. DICE and ASD of different methods on different training sample sizes.

表 1. 不同训练样本大小下各种方法的DICE和ASD。

图片

Table 2. DICE results of different cardiac sub-structures, for different methods trained with different sample sizes.

表 2. 不同心脏亚结构的DICE结果,对于用不同样本大小训练的不同方法。

图片

Table 3. ASD results of different cardiac sub-structures, for different methods trained with different sample sizes.

表 3. 不同心脏亚结构的ASD结果,对于用不同样本大小训练的不同方法。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/479845.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

InnoDB 缓存

本文主要聊InnoDB内存结构, 先来看下官网Mysql 8.0 InnoDB架构图 MySQL :: MySQL 8.0 Reference Manual :: 17.4 InnoDB Architecture 如上图所示,InnoDB内存主要包含Buffer Pool, Change Buffer, Log Buffer, Adaptive Hash Index Buffer Pool 其实 buffer pool 就是内存中的…

网络安全协议基本问题

Http和Https协议的端口号: Http:80 Https:443 网络监听: 网络监听是一种监视网络状态、数据流程以及网络上信息传输的工具,它可以将网络界面设定成监听模式,并且可以截获网络上所传输的信息。但是网络监…

Linux:权限的概念与理解

目录 1. Linux权限的概念 2. Linux权限管理 01.文件访问者的分类 02.文件类型和访问权限 03.文件权限值的表示方法 04. 文件访问权限的相关设置方法 3. 使用 sudo分配权限 4. 目录的权限 ---------- 权限 用户角色(具体的人) 文件权限属性 ---------- 1. Linux权限的…

大英赛-选择题 (持续更新中)

解题策略: 十五分钟内写完,单选: ABCD全部单项选择题 考的语法点弄清不懂得话 看《张道真语法》 不会的单词建议下载墨墨背单词 直接把不会的加入到要背的里面 知识点 2019年初赛: 2019年决赛:

QT信号和槽机制connect用法

信号与槽机制是绝对不可或缺且常用的&#xff0c;其中的参数一般都会比较简单&#xff0c;bool、int、QString之类的&#xff0c;但当我们想要传递相对比较复杂的参数&#xff0c;例如QVector<int>、QList<QString>&#xff0c;以及一些我们自定义的结构体时&#…

白酒:蒸馏过程中香味成分的生成机制与调控技术

在豪迈白酒的酿造过程中&#xff0c;蒸馏是关键的步骤之一&#xff0c;它决定了白酒的香味成分和品质。云仓酒庄对蒸馏过程中香味成分的生成机制与调控技术进行了深入研究&#xff0c;以提高产品的风味和品质。 首先&#xff0c;蒸馏过程中香味成分的生成机制是一个复杂的过程。…

第四百一十八回

文章目录 1. 概念介绍2. 思路与方法2.1 实现思路2.2 实现方法 3. 示例代码4. 内容总结 我们在上一章回中介绍了"自定义标题栏"相关的内容&#xff0c;本章回中将介绍自定义Action菜单.闲话休提&#xff0c;让我们一起Talk Flutter吧。 1. 概念介绍 我们在这里提到的…

图和树的路径问题

图 一&#xff1a;用vector存储无向图 数据结构 const int N 100; vector<int> G[N]; void addEdge(int u, int v){// 无向图G[u].push_back(v);G[v].push_back(u); } int m; // 点的个数创建图 void printList(){for (int i 0; i < m;i){cout << i<<…

NFT Insider #124:Aavegotchi 开启新一季稀有度挖矿,德克萨斯州奥斯汀市登陆 The Sandbox

引言&#xff1a;NFT Insider由NFT收藏组织WHALE Members&#xff08;https://twitter.com/WHALEMembers&#xff09;、BeepCrypto &#xff08;https://twitter.com/beep_crypto&#xff09;联合出品&#xff0c;浓缩每周NFT新闻&#xff0c;为大家带来关于NFT最全面、最新鲜、…

基于Gabor滤波器的指纹图像识别,Matlab实现

博主简介&#xff1a; 专注、专一于Matlab图像处理学习、交流&#xff0c;matlab图像代码代做/项目合作可以联系&#xff08;QQ:3249726188&#xff09; 个人主页&#xff1a;Matlab_ImagePro-CSDN博客 原则&#xff1a;代码均由本人编写完成&#xff0c;非中介&#xff0c;提供…

Windows系统部署hMailServer邮件服务结合内网穿透实现公网收发邮件

文章目录 前言1. 安装hMailServer2. 设置hMailServer3. 客户端安装添加账号4. 测试发送邮件5. 安装cpolar6. 创建公网地址7. 测试远程发送邮件8. 固定连接公网地址9. 测试固定远程地址发送邮件 前言 hMailServer 是一个邮件服务器,通过它我们可以搭建自己的邮件服务,通过cpola…

外包干了6天,技术退步明显。。。。

说一下自己的情况&#xff0c;本科生&#xff0c;19年通过校招进入上海某软件公司&#xff0c;干了接近4年的功能测试&#xff0c;今年年初&#xff0c;感觉自己不能够在这样下去了&#xff0c;长时间呆在一个舒适的环境会让一个人堕落!而我已经在一个企业干了四年的功能测试&a…

【FFT实战篇】C++实现:利用快速傅里叶变换快速计算(多项式)乘法

本文使用C语言实现了快速傅里叶变换FFT并运用其进行多项式乘法计算&#xff0c;适合供学习过《数字信号处理》的读者学习使用FFT快速计算乘法。当然也可供对快速乘法感兴趣的没有系统学习过数字信号处理&#xff08;从CFT到DTFT到DFT&#xff09;的读者参考&#xff0c;提供一种…

如何真正改变自己? 《掌控习惯》

维持改变 1.心态 目标与体系&#xff0c;谁是真正通往成功的钥匙&#xff1f; 2.行动 习惯转变的3个层次 身份 你要成为谁&#xff1f; 你为成为他而幸福吗&#xff1f;过程结果 习惯的基本原理&#xff1a;要重视微小的改变 维持改变成两个方面入手 一、心态&#xff1a;忽略…

面向对象编程三大特征

基本介绍 面向对象编程有三大特征&#xff1a;封装、继承和多态。 1、封装介绍 2、继承介绍 3、多态介绍 向上转型与向下转型 多态常用案例 数值比较。

Oracle 写丢失保护/影子表空间(Lost Write Protection with Shadow Tablespace)

写丢失是Oracle数据库与独立I/O子系统交互时一种错误场景。假如Oracle发出的写磁盘命令&#xff0c;I/O子系统也返回成功写磁盘的消息&#xff08;但数据此时可能依然在I/O系统缓存中&#xff09;&#xff0c;如果在I/O系统实际写盘之前Oracle再次读取该数据&#xff0c;则I/O系…

机器人路径规划:基于红尾鹰算法(Red‑tailed hawk algorithm ,RTH)的机器人路径规划(提供MATLAB代码)

一、机器人路径规划介绍 移动机器人&#xff08;Mobile robot&#xff0c;MR&#xff09;的路径规划是 移动机器人研究的重要分支之&#xff0c;是对其进行控制的基础。根据环境信息的已知程度不同&#xff0c;路径规划分为基于环境信息已知的全局路径规划和基于环境信息未知或…

软考中级 --网络工程师真题试卷 2023下半年

在EIGRP协议中&#xff0c;某个路由器收到了两条路径到达目标网络&#xff0c;路径1的带宽为100Mbps&#xff0c;延迟2ms&#xff0c;路径2的带宽为50Mbps&#xff0c;迟为4ms&#xff0c;如果EIGRP使用带宽和延迟的综合度量标准&#xff0c;那么该路由器选择的最佳路径是(D)。…

Vue.js+SpringBoot开发教学过程管理系统

目录 一、摘要1.1 项目介绍1.2 项目录屏 二、功能模块2.1 教师端2.2 学生端2.3 微信小程序端2.3.1 教师功能如下2.3.2 学生功能如下 三、系统展示 四、核心代码4.1 查询签到4.2 签到4.3 查询任务4.4 查询课程4.5 生成课程成绩 六、免责说明 一、摘要 1.1 项目介绍 基于JAVAVu…

高架学习笔记之系统分析与设计

目录 一、结构化方法&#xff08;SASD&#xff09; 1.1. 结构化分析方法&#xff08;SA&#xff09; 1.1.1. 数据流图&#xff08;DFD&#xff09; 1.1.2. 实体联系图&#xff08;E-R图&#xff09; 1.1.3. 状态转换图(STD) 1.1.4. 数据字典 1.2. 结构化设计方法&#x…