医学图像融合的深度学习方法综述

文章目录

  • Deep learning methods for medical image fusion: A review
    • 摘要
    • 引言
    • 非端到端的融合方法
      • 基于深度学习的决策映射
      • 基于深度学习的特征提取
    • 端到端图像融合方法
      • 基于卷积神经网络(CNN)的图像融合方法
      • 单级特征融合方法
      • 多级特征融合
      • 基于残差神经网络的图像融合方法
      • 基于密集神经网络(DenseNet)的图像融合方法
      • 基于生成对抗网络的图像融合方法
      • 基于编码器-解码器网络的图像融合方法

Deep learning methods for medical image fusion: A review

摘要

基于深度学习的图像融合方法是近年来计算机视觉领域的研究热点。
本文从五个方面对这些方法进行了综述:
首先,阐述了基于深度学习的图像融合方法的原理和优点;
其次,从端到端和非端到端两方面对图像融合方法进行了总结,根据深度学习在特征处理阶段的不同任务,将非端到端图像融合方法分为决策映射深度学习和特征提取深度学习两大类。
根据网络类型的不同,将端到端图像融合方法分为三类:
基于卷积神经网络的图像融合方法、基于生成对抗网络的图像融合方法和基于编码器-解码器网络的图像融合方法;
第三,从方法和数据集两个方面总结了基于深度学习的图像融合方法在医学图像领域的应用;
第四,从14个方面对医学图像融合领域常用的评价指标进行了梳理;
第五,从数据集和融合方法两个方面讨论了医学图像融合面临的主要挑战。
并对未来的发展方向进行了展望。本文系统总结了基于深度学习的图像融合方法,对多模态医学图像的深入研究具有积极的指导意义。

引言

图像融合算法可分为两类:变换域算法和空间域算法。
基于变换域的算法通常基于多尺度变换(MST)理论,如拉普拉斯金字塔变换(LP)、小波变换(WT)、曲线波变换(CVT)和非下采样Contourlet变换(NSCT)。这些方法的步骤如下:首先将源图像分解为系数,然后通过融合规则对系数进行融合,最后通过变换逆重构融合后的图像。除了MST方法外,近年来还提出了一些基于特征空间的方法,如独立分量分析(ICA)和稀疏表示(SR)。然而,这些方法都存在一些缺点:融合规则由开发者设计,融合图像需要配准,图像重建也会导致图像质量下降。
基于空间域的算法不需要将源图像转换为另一个特征域,它具有很好的应用前景,可分为基于块的、基于区域的和基于像素的融合算法。基于分块的算法通常将图像分割成块,测量其空间频率,求和并修改拉普拉斯,然后融合图像块,在这些算法中,图像块的大小对结果影响很大,难以分割;基于区域的算法根据一定的准则将输入图像分解成区域,然后测量相应区域的显著性,最后将最显著的区域组合成融合图像。但是图像分割的准确性对算法的效率有很大的影响。基于像素的算法直接通过活动水平度量策略生成融合决策图,并提出了一些基于像素的空间域方法,如多尺度加权梯度融合(MWGF)、带引导滤波的图像融合(GFF)和密集SIFT,这些方法在融合过程中基于单个像素,忽略了信息的相似性。

近年来,深度学习的发展推动了图像融合的进步,深度学习强大的特征提取和数据表达能力使得图像融合的发展非常有前景。深度学习方法从大量数据中学习具有良好泛化能力的融合模型,可以使融合过程更具鲁棒性,克服人工特征选择耗时、成本高、容易出现人为错误等缺点,显示出强大的发展潜力。

基于深度学习的图像融合分为三个阶段:特征处理阶段、特征融合阶段和特征重构阶段
具体过程如下:首先,通过深度学习网络获取特征信息或决策图;然后,它们通过融合策略进行融合。最后,通过特征处理反变换得到融合图像。由于深度学习网络在特征提取和信息表达方面的强大能力,可以显著提高融合图像的质量。
本文将基于深度学习的融合方法分为两类:非端到端图像融合方法和端到端图像融合方法。

非端到端的融合方法

非端到端图像融合方法是指深度学习网络在融合阶段之前的特征处理阶段的应用。其过程如下:首先,通过深度学习网络对源图像进行处理,得到特征信息或决策图;然后,根据融合规则对特征进行融合;最后,对融合后的特征进行重构,得到最终的融合图像。
有效的特征处理方法是高质量融合方法的前提,图像表示理论的发展对图像融合的进展有很大的影响,促进了融合规则的进一步完善。本节将从两个方面进行介绍:基于深度学习的决策映射和基于深度学习的特征提取。
在这里插入图片描述

基于深度学习的决策映射

首先,将源图像分成块,将这些块作为网络的输入,并构造分类任务来判断每个块的类别;其次,通过对特征图进行线性卷积、非线性激活和空间池化,对不同阶段的特征图进行合并,输出包含源图像特征信息的决策图;第三,对决策图进行处理;最后,利用融合规则对决策映射进行融合,得到最终的融合图像。
在这里插入图片描述
第一类是基于CNN的决策映射。Wang等人将分解后的高频子带输入到CNN中生成决策图,并将CNN作为频率子带的融合规则,该规则不仅具有自适应性,而且取代了需要人工设计的传统规则,然后分别对低频子带和高频子带的决策图进行融合,最后对融合系数进行逆变换,得到最终的融合图像。
第二类是基于ResNet的决策映射。为了解决边界模糊水平估计困难的问题,提出将源图像输入到卷积块和残差块组成的CNN中,提取浅特征和深特征,得到其对应的加权映射,对其进行点积和加权和运算,得到融合图像。该方法可以利用源图像中存在的互补信息
第三类是基于DenseNet的决策映射。Gai等人将源图像块输入到DenseNet中得到评分图,然后通过二值化得到决策图,最后利用融合规则得到融合图像。在特征处理阶段,DenseNet可以充分利用图像的特征信息,有效地解决融合图像决策图的分类问题
第四类是基于U-Net的决策映射,为了提高U-Net的全局特征编码能力,引入全局特征金字塔提取模块(GFPE)和全局注意力连接上采样模块(GACU),有效地提取和利用全局语义和边缘信息,通过特征图中像素间的上下文关系估计最终的决策图,最后采用逐像素加权平均策略获得融合图像
第五类是基于GAN的决策映射。Guo等人提出了一种基于cGAN的图像融合方法,称为融合GAN。该方法将图像融合任务视为从源图像到决策图的转换问题,并利用最小二乘GAN目标提高融合GAN的训练稳定性,得到准确的置信图用于焦点区域检测

基于深度学习的特征提取

在这里插入图片描述
深度学习中特征提取的过程是:首先将源图像输入深度学习网络进行特征提取,然后将各输出层的特征信息通过融合规则进行融合,最后通过重构过程得到融合后的图像。网络的输入是源图像,输出是特征信息。这些过程如图3所示。深度学习方法具有比传统方法更强的特征提取能力,被广泛应用于图像融合领域。
第一类是基于CNN,提取源图像的低级和高级特征,得到候选融合图像,利用最大值策略从候选融合图像生成最终融合图像,完成融合图像的重建。
第二类是基于ResNet的特征提取。使用ResNet50作为特征提取模块,从源图像中提取深度特征,然后将深度特征归一化得到初始权值图,最后采用加权平均策略重构融合后的图像。
第三类是基于DenseNet的提取。Zhang等人使用DenseNet通过密集连接提取特征并重用特征,以更少的参数和计算成本取得了比CNN更好的性能,最后通过平均融合策略重建融合后的图像。用更少的网络层保留了更多的融合图像细节
第四节课是基于注意机制的特征抽取。提出了多尺度剩余金字塔注意网络(MSRPAN),与剩余注意机制相比,MSRPAN增加了多尺度信息,与金字塔注意机制相比,MSRPAN增强了特征提取能力,具有更好的特征提取和表达能力

端到端图像融合方法

在非端到端图像融合方法中,有时特征提取阶段的最优特征并不是最终的最佳结果

端到端图像融合是指网络的输入是源图像,输出是融合后的图像。整个学习过程不划分子过程,深度学习模型学习从源图像到融合图像的映射。端到端图像融合方法包括基于CNN的图像融合方法、基于GAN的图像融合方法和基于编码器-解码器网络的图像融合方法。对端到端图像融合方法进行了综述。

基于卷积神经网络(CNN)的图像融合方法

通过设计网络结构和损失函数实现隐式特征提取、特征融合和图像重建,避免了人工设计融合规则的局限性。基于CNN的图像融合方法的过程是:首先将源图像输入CNN进行处理,然后对处理后的特征进行融合,最后对融合后的图像进行反卷积重构。在这个过程中,不需要中间结果的输出,CNN学习了从输入到输出的直接映射。与传统的图像融合算法相比,CNN可以通过学习卷积滤波器的适当参数来适应图像融合任务,并且可以通过端到端训练来优化CNN模型的参数。本节从单级特征融合方法、多级特征融合方法、基于ResNet的图像融合方法和基于DenseNet的图像融合方法四个方面对基于CNN的图像融合方法进行了总结,这些过程如图4所示
在这里插入图片描述

单级特征融合方法

首先通过多个卷积块提取源图像的特征,然后对最后一个卷积层输出的特征进行融合,最后通过多个反卷积块对特征进行重构,得到最终的融合图像。

UFA-FUSE利用卷积块从源图像中提取图像特征,然后通过注意机制进行特征融合,最后将融合后的图像特征输入级联卷积块中重建融合后的图像,该方法通过后处理细化决策图,避免中间决策图的生成,实现图像融合

为了提高图像融合的质量,在基于多尺度MobileNet的融合(Multi-scale MobileNet based fusion, MMF)中,通过多尺度移动块(Multi-scale Mobile Block, MMB)提取输入图像的高维特征,结合高维特征生成融合图像

多级特征融合

首先通过卷积块提取源图像的特征,然后将每一卷积层提取的对应层的特征进行融合,将每一层的融合特征进行融合,生成最终的融合图像。多层次特征融合可以使图像特征得到更充分的利用。

在HPCFNet中,首先将配对图像输入到Siamese CNN中,然后通过配对通道融合(paired Channel Fusion, PCF)模块对卷积层的特征映射进行层次化集成,生成逐通道融合特征映射,再通过反向空间注意(Reverse Spatial Attention, RSA)模块对融合特征映射进行调整。PCF首先通过交叉特征堆栈(Cross feature Stack, CFS)组合同一级别的特征映射,然后通过并行群卷积(Parallel Atrous Group Convolution, PAGC)模块融合通道对,获取多尺度特征表示

基于残差神经网络的图像融合方法

在基于CNN的融合方法中,浅层特征随着网络层数的增加而松散,降低了融合效果。基于ResNet的融合方法可以更好地利用提取的特征信息,融合后的图像可以保留更多的源图像细节。这些方法可以分为两类:用于图像融合的全局残差连接和用于图像融合的残差块。
在这里插入图片描述
在这里插入图片描述
第三类是多尺度残差块。接收野较小的卷积层可以提取低频特征,但不能提取高频特征,而接收野较大的卷积层可以提取更重要的图像特征。Song等人设计了多尺度扩展残差块(MDRB),通过两个并行卷积核提取多尺度特征,并将特征输入到两个不同扩展率的卷积核中,扩大接收场,计算成本较低

残差注意块是通过在残差块上添加一个注意机制来实现的,残差块根据源特征映射的重要性给出其权重,残差连接使注意机制能够全局学习每个通道的权重,大大增强了注意块的通用性。Mustafa等人引入残差自注意块来融合和细化特征,残差自注意块的输出是原始局部特征和注意图的加权和,其中还包含自注意信息和全局上下文信息

基于密集神经网络(DenseNet)的图像融合方法

在这里插入图片描述
基于DenseNet的图像融合方法是指在CNN中加入密集连接,或者用密集块代替卷积块。这些过程如图7所示。DenseNet能够利用浅层的低复杂度信息获得更平滑的决策函数,因此具有更好的泛化性能[42]。与残块相比,致密块具有更强的致密连接机制。通过密集连接,可以充分利用每一层的特征,保证融合后的图像包含更多源图像的多尺度、多层次特征,缓解梯度消失的问题。

基于生成对抗网络的图像融合方法

自2014年GAN[46]被提出以来,由于其灵活性和优异的性能,在成像领域得到了广泛的应用。基于GAN的图像融合过程可以看作是源图像与融合图像之间的对抗博弈,更具体地说,基于GAN的图像融合方法使用鉴别器迫使生成器生成在概率分布上与目标分布一致的融合结果,从而隐含地实现了特征提取、融合和图像重建。这使得融合图像能够同时获得两个源图像的特征信息。这些过程如图8所示。基于GAN的图像融合方法可分为三类:基于经典GAN的图像融合方法、基于双鉴别器GAN的图像融合方法和基于多GAN的图像融合方法。
在这里插入图片描述

基于编码器-解码器网络的图像融合方法

在这里插入图片描述
基于单编码器-解码器网络的图像融合方法是指包含一个编码器的融合网络,其过程为:将拼接后的图像输入到编码器中提取特征;然后,对编码特征进行融合;最后对融合特征进行解码,得到最终的融合图像。

DenseFuse是一个典型的编码器-解码器图像融合网络,其中编码器由卷积块和密集块组成,密集块可以更好地保留编码器的深度特征,从而保证融合规则可以使用更重要的特征,融合层的输出是解码器的输入,解码器由四个卷积层完成

基于双编码器-解码器网络的图像融合方法源图像在单编码器-解码器融合网络的输入端进行拼接,但不同模态的图像具有不同的细节信息,需要以不同的方式提取特征,因此提出了双编码器-解码器融合网络。每个编码器的目的都是提取图像的视觉特征,其优点是保证两幅模态图像的不同信息能够得到充分利用。

由于在图像融合任务中往往需要融合两幅以上的图像,现有的方法大多以两幅图像的融合为目标,为了在融合多模态医学图像的同时保留各种图像类型的更详细信息,提出了多编码器-解码器融合网络,通过信息共享获得更好的融合结果。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/88310.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

怎么把PDF转成Word?需要注意什么事项?

PDF是一种常见的文档格式,但是与Word文档不同,PDF文件通常不能直接编辑。如果您想编辑PDF文件中的文本,或者想将PDF文件转换为Word文档,下面我们就来看一看把PDF转成Word有哪些方法和注意事项。 PDF转Word工具 有许多将PDF转换为…

RISCV 6 RISC-V加载存储指令

RISCV 6 RISC-V加载存储指令 1 RV32I Load and Store Instructions1.1 LOAD instructions1.1.1 加载指令的指令格式1.1.2 加载指令在使用时需要注意的点 1.2 STORE instructions1.2.1 存储指令的指令格式1.2.2 存储指令在使用时需要注意的点 2 RV64 Load and Store Instruction…

常见前端面试之VUE面试题汇总六

17. MVVM 的优缺点? 优点: 分离视图(View)和模型(Model),降低代码耦合,提⾼视图或者 逻辑的重⽤性: ⽐如视图(View)可以独⽴于 Model 变化和修改,⼀个 ViewModel 可以…

数据结构基础:P3-树(上)----编程作业01:List Leaves

本系列文章为浙江大学陈越、何钦铭数据结构学习笔记,系列文章链接如下: 数据结构(陈越、何钦铭)学习笔记 文章目录 一、题目描述二、整体思路与实现代码 一、题目描述 题目描述: 给定一棵树,按照从上到下、从左到右的顺序列出所有…

设计模式大白话——命令模式

命令模式 一、概述二、经典举例三、代码示例(Go)四、总结 一、概述 ​ 顾名思义,命令模式其实和现实生活中直接下命令的动作类似,怎么理解这个命令是理解命令模式的关键!!!直接说结论是很不负责…

微服务中间件--MQ服务异步通信

MQ服务异步通信 MQ服务异步通信a.消息可靠性1) 生产者消息确认2) 消息持久化3) 消费者消息确认4) 消费者失败重试4.a) 本地重试4.b) 失败策略 b.死信交换机1) 初识死信交换机2) TTL3) 延迟队列a) 安装延迟队列插件b) SpringAMQP使用延迟队列插件 c.惰性队列1) 消息堆积问题2) 惰…

docker高级(mysql主从复制)

数据库密码需要设置成自己的!!! 1、创建容器master13307 #docker pulldocker run -p 13307:3306 --name mysql-master \ --privilegedtrue \ -v /mysql/mysql-master/log:/var/log/mysql \ -v /mysql/mysql-master/data:/var/lib/mysql \ -…

【大模型AIGC系列课程 2-2】大语言模型的“第二大脑”

1. 大型语言模型的不足之处 很多人使用OpenAI提供的GPT系列模型时都反馈效果不佳。其中一个主要问题是它无法回答一些简单的问题。 ● 可控性:当我们用中文问AI一些关于事实的问题时,它很容易编造虚假答案。 ● 实时性:而当你询问它最近发生的新闻事件时,它会干脆地告诉你…

Flink_state 的优化与 remote_state 的探索

摘要:本文整理自 bilibili 资深开发工程师张杨,在 Flink Forward Asia 2022 核心技术专场的分享。本篇内容主要分为四个部分: 相关背景state 压缩优化Remote state 探索未来规划 点击查看原文视频 & 演讲PPT 一、相关背景 1.1 业务概况 从…

记录一个用C#实现的windows计时执行任务的服务

记录一个用C#实现的windows计时执行任务的服务 这个服务实现的功能是每天下午六点统计一次指定路径的文件夹大小 using System; using System.Collections.Generic; using System.ComponentModel; using System.Data; using System.Diagnostics; using System.IO; using Syst…

【1267. 统计参与通信的服务器】

来源:力扣(LeetCode) 描述: 这里有一幅服务器分布图,服务器的位置标识在 m * n 的整数矩阵网格 grid 中,1 表示单元格上有服务器,0 表示没有。 如果两台服务器位于同一行或者同一列&#xff…

IDEA创建Spring,Maven项目没有resources文件夹

有时新建Spring或Maven项目时,会出现目录中main下无resources文件夹的情况,来一起解决一下: FIles|Project Structure 在Modules模块找到对应路径,在main下创建resources,右键main,选择新文件夹 输入文件…

『C语言入门』初识C语言

文章目录 前言C语言简介一、Hello World!1.1 编写代码1.2 代码解释1.3 编译和运行1.4 结果 二、数据类型2.1 基本数据类型2.2 复合数据类型2.3 指针类型2.4 枚举类型 三、C语言基础3.1 变量和常量3.2 运算符3.3 控制流语句3.4 注释单行注释多行注释注释的作用 四、 …

bilibiliDown-极简纯净B站视频解析提取工具

bilibiliDown是一款免费极简纯净B站视频解析提取工具,可一键解析单视频、合集、分集、封面、srt字幕、xml弹幕、ass弹幕、视频下载链接,帮助你轻松将bilibili视频下载到本地电脑或手机相册,工具是一个前后端分离的项目,使用spring…

JMeter分布式集群---部署多台机器进行性能压力测试

有些时候,我们在进行压力测试的时候,随着模拟用户的增加,电脑的性能(CPU,内存)占用是非常大的,为了我们得到更加理想的测试结果,我们可以利用jmeter的分布式来缓解机器的负载压力,分…

Mobx在非react组件中修改数据,在ts/js中修改数据实现响应式更新

我们都之前在封装mobx作为数据存储的时候,使用到了useContext作为包裹,将store变成了一个hooks使用,封装代码: import React from react import UserInfo from ./user import Setting from ./seting import NoteStore from ./noteclass Stor…

软件开发中常用数据结构介绍:C语言队列

工作之余来写写C语言相关知识,以免忘记。今天就来聊聊C语言实现循环队列,我是分享人M哥,目前从事车载控制器的软件开发及测试工作。 学习过程中如有任何疑问,可底下评论! 如果觉得文章内容在工作学习中有帮助到你&…

Microsoft Excel整合Python:数据分析的新纪元

🌷🍁 博主猫头虎 带您 Go to New World.✨🍁 🦄 博客首页——猫头虎的博客🎐 🐳《面试题大全专栏》 文章图文并茂🦕生动形象🦖简单易学!欢迎大家来踩踩~🌺 &a…

【科研】-- 如何将Endnote中参考文献格式插入到Word?

文章目录 如何将Endnote中参考文献格式插入到Word? 如何将Endnote中参考文献格式插入到Word? 1、首先确保Endnote和Word安装正确,正常可以从学校官网中下载到正版软件,下载后在word栏目中会出现EndNote的标签; 2、可…

ChatGPT + Flutter快速开发多端聊天机器人App

下载地址:ChatGPT Flutter快速开发多端聊天机器人App 下载地址:ChatGPT Flutter快速开发多端聊天机器人App
最新文章