【SSconv:全色锐化:显式频谱-空间卷积】

SSconv: Explicit Spectral-to-Spatial Convolution for Pansharpening

(SSconv:用于全色锐化的显式频谱-空间卷积)

全色锐化的目的是融合高空间分辨率的全色(PAN)图像和低分辨率的多光谱(LR-MS)图像,以获得与PAN图像具有相同空间分辨率的多光谱图像。由于卷积神经网络(CNN)的灵活结构,它们已成功地应用于泛锐化问题。然而,大多数现有方法仅简单地将上采样的LR-MS馈送到CNN中,并且忽略了由直接上采样引起的空间失真。本文提出了一种显式谱-空卷积(SSConv)算法,该算法将光谱特征聚集到空间域进行上采样操作,可以获得比直接上采样更好的性能。此外,SSconv被嵌入到一个多尺度U形卷积神经网络(MUCNN),充分利用所涉及的图像的多光谱信息。特别是,多尺度注入分支和混合损失的跨尺度水平融合逐像素的图像信息。受益于SSconv的无失真特性,所提出的MUCNN可以在从WorldView-3和GaoFen-2获得的降低分辨率和全分辨率数据集上以简单的结构产生最先进的性能。

介绍

随着光谱成像技术的发展,多光谱图像在医学、地质、农业等领域的应用越来越重要。MS图像通常由部署在卫星上的传感器获取。但由于硬件限制,传感器无法同时保证拍摄图像的光谱和空间分辨率。传感器通常获取高分辨率(HR)PAN图像或低分辨率(LR)MS图像。2006年的竞赛和许多最近的评论论文证明了pansharpening的流行。为了充分利用LR-MS图像中丰富的光谱信息和HR-PAN图像中的空间信息,研究人员提出了全色锐化的思想,试图将HR-PAN图像和LR-MS图像融合得到HR-MS图像。全色锐化的主要挑战是在避免失真的基础上实现光谱和空间信息之间的平衡。因此,有必要充分掌握HR-PAN图像和LR-MS图像的特征,以及它们之间的潜在关系,特别是它们的光谱和空间分辨率之间的差异。
最新的锐化策略可以分为四类:1)基于组分替代(CS)的方法;2)基于多分辨率分析的方法;3)基于变分模型的方法;4)基于深度学习(DL)的方法。前三类可以归类为传统方法,而最近基于卷积神经网络(CNN)的深度学习在广泛的视觉任务中取得了巨大成功,如图像识别,目标检测和单幅图像超分辨率。受LR-MS图像、HR-PAN图像和期望的HR-MS图像之间的关系的映射需求的驱动,已经提出了各种基于DL的方法来改善全色锐化的融合结果,因为它们可以在大量现有数据集上训练后生成更多细节。基于DL的方法能够取得先进结果的原因在于CNN强大的非线性拟合和特征提取能力。
全色锐化的一个不可避免的问题是减轻HR-PAN图像和LR-MS图像的空间分辨率之间差距。上采样作为一种提高空间分辨率的操作,在信息融合过程中具有重要的作用。现有的上采样方法包括线性内插、去卷积和去池化。直接线性插值上采样是最常见的一种,它基于相邻像素的平均值粗略地补充图像。虽然它简单而快速,但其结果往往会出现意想不到的平滑。与预定义的插值方法不同,具有可学习参数的反卷积已广泛用于分割任务,并取得了良好的效果。然而,在卷积运算之前,特征图需要用零填充,因此大量的信息是相当无用的,并且其计算过程在计算上是昂贵的。另一种方法,unpooling,通过直接零填充来升级特征图的分辨率,因此无法探索像素及其相邻像素之间的潜在信息。值得一提的是,上采样对于单个图像超分辨率任务同样至关重要。提出了一种用于单通道特征图的高效且有效的上采样方法。在他们的工作中,原始LR图像通过卷积和周期性shuffling重建为HR图像。受此启发,我们认为,通过类似的像素重排操作,可以在卷积的帮助下学习光谱到空间特征的映射,这非常适合于处理多光谱图像,如全色锐化。
除了上采样方法的具体操作之外,我们还考虑上采样与LR-MS的比率。大多数现有的基于DL的方法将原始LR-MS图像直接上采样到与HR-PAN图像相同的分辨率,这可能导致光谱失真和信息丢失。本文提出了一种新的具有多尺度注入分支的U形网络,充分利用了原始LR-MS图像和HR-PAN图像提供的信息。特别地,我们设计了一个频谱到空间卷积(SSconv)的上采样在泛锐化中,以避免由传统的上采样方法所造成的失真。在U型网络和多尺度注入分支的基础上,我们在网络的过程中产生了不同尺度的特征图。为了监督网络学习过程中的中间产物,提出了一种混合损失策略。最后,所提出的方法在从两颗卫星获得的多个数据集上进行了验证,即,WorldView-3和GaoFen-2。通过对降低的分辨率和全分辨率进行的实验分析,证实了所提出的多尺度U形卷积神经网络(MUCNN)能够优于各种竞争方法。

贡献

1)我们设计了一个Spectral-to-Spacial卷积来将光谱特征聚合到空间域。除了通过充分利用光谱信息来提高特征图的空间分辨率外,SSconv还有助于构建MUCNN中的特征图。
2)我们提出了一个U形卷积神经网络与多尺度注入分支融合的信息在空间和光谱域。
3)采用混合损失策略来监督具有三种不同尺度的输出MS图像,并通过反向传播进行训练,这可以利用丰富的特征层次结构。此外,我们的方法显着超过了现有的最先进的方法与一个简单的结构。

注释和相关工作

Notations

为了清楚和方便,有必要介绍本文中使用的符号。MS ∈ R w × h × b R^{w×h×b} Rw×h×b表示观察到的LR-MS图像,其中w、h和b分别表示图像的宽度、高度和光谱带。P ∈ R W × H × 1 R^{W×H×1} RW×H×1表示观察到的PAN图像,其中H = 4h,W = 4w,GT ∈ R W × H × b R^{W×H×b} RW×H×b是地面实况图像。所需的HR-MS图像定义为^MS R W × H × b R^{W×H×b} RW×H×b。除此之外,我们通过SSconv对MS进行上采样,以获得2 ↑和4 ↑ MS图像,定义为MS2↑ R 2 w × 2 h × b R^{2w×2h×b} R2w×2h×b和MS4↑ R W × H × b R^{W×H×b} RW×H×b。我们使用步长为2的2 × 2卷积和步长为4的4 × 4卷积对P进行下采样,从而获得2 ↓和4 ↓ P图像,定义为P2↓ R 2 w × 2 h × 1 R^{2w×2h×1} R2w×2h×1和P4↓ ∈ R w × h × 1 R^{w×h×1} Rw×h×1

CNNs for pansharpening

正如在引言中提到的,近年来在全色锐化领域出现的大多数基于DL的方法都是基于CNN的。Masi等人提出了第一种基于DL的泛锐化方法,将其命名为PNN,它只是简单地堆叠三个卷积层并取得了显着的结果。从那时起,已经提出了越来越多的基于DL的方法。一项名为PanNet的值得注意的工作提出了一种具有一定程度的物理可解释性的简单结构,其重点是光谱和空间保存。后续工作,例如:DMDNet和FusionNet进一步探索了神经网络的潜力,并取得了令人鼓舞的结果。总体而言,CNN在全色锐化中的应用的主要框架可以被描述为非线性映射fΘFS,其中ΘFS表示CNN的参数。并且它们的损失函数可以统一为如下:在这里插入图片描述
然而,现有的方法可能无法捕获由尺度和分辨率变化引起的复杂特征。他们的大多数网络结构提取和学习与HR-PAN图像相同大小的上采样LRMS图像的特征。并且只关注最终输出而不考虑中间卷积层的产物。

U-Net

U-Net 是一种为逐像素分割设计的经典网络架构,已被证明具有良好的性能。特别是,它学习不同级别的语义特征,并通过几个下采样步骤来减小特征图的大小。然后通过上采样步骤逐渐恢复特征图的大小,并成功地使用所提取的语义特征来完成最终的分割任务。在我们工作的同时,有几个原因促使我们选择它作为我们的骨干。首先,全色锐化也是一个逐像素的任务,需要细化到每个像素的特征以及与其邻域的关系。因此,我们认为U型网络强大的目标定位和描绘能力可以应用于锐化任务。其次,金字塔功能满足我们的期望,克服LR-MS和HR-PAN图像之间的空间分辨率差距。U形网络提供了通过阶段跨尺度融合图像的可能性。第三,在U-Net的结构中,特征图被渐进地传播,这与全色锐化任务的目的一致,因为可以在特征图中恢复更详细的信息。

方法

该模型采用多尺度输入和U型CNN来研究空间、光谱特征及其相互关系。所提出的MUCNN由四个部分组成,它们是:(1)SSconv用于多光谱图像的上采样操作,(2)多尺度注入分支,其将MS图像和PAN图像渐进地馈送到网络,(3)U形整体网络结构,在像素级问题上表现优异,(4)混合多尺度损失,起到加速网络反向传播的作用,并对融合结果进行分阶段检验。

Spectral-to-Spatial Convolution

由于LR-MS图像包含同一场景的不同光谱波段,可以将其视为多图像超分辨率问题。我们相信,不同光谱波段的信息聚合将有助于空间信息的重建。因此,我们提出了一种新的频谱到空间卷积来执行上采样操作。操作过程如图2所示,我们使用r2b卷积(3×3)来整合空间和光谱特征,其中r是上采样的比率。请添加图片描述
通过对每个r2b波段的像素映射,生成上采样LR-MS图像。例如,第i个特征图Oi R w × h R^{w×h} Rw×h通过对X ∈ R w × h × b R^{w×h×b} Rw×h×b进行以下运算获得:在这里插入图片描述
其中Ki ∈ R1×3×3×b表示第i个卷积核,⊕表示传统CNN中的卷积运算。然后,我们可以通过映射(如图2所示)获得上采样的X:

请添加图片描述
其中SSconv(X)~ri+ cl,ri +c2,k~表示上采样图像的像素,SSconv(·)是SSconv操作。当谱带数b = 1时,问题退化为单图像超分辨率问题.此外,SSconv也退化为像素混洗。更多细节请参见图2。

Multiscale injection branch

P和MS之间的空间分辨率的比率是4。为了充分挖掘图像的潜在信息并建立P、MS和^MS之间的关系模型。我们打算采用已知图像,即P、MS作为多尺度金字塔形式的输入。在这里插入图片描述
如图3所示,通过SSconv对MS进行两次上采样,获得MS2↑ R 2 w × 2 h × b R^{2w×2h×b} R2w×2h×b和MS4↑ R 4 w × 4 h × b R^{4w×4h×b} R4w×4h×b,如下所示:在这里插入图片描述
均匀尺寸的卷积,即,2×2和4×4用于下采样图像,其有效性已得到验证。我们得到P2↓ R 2 w × 2 h × 1 R^{2w×2h×1} R2w×2h×1和P4↓ R w × h × 1 R^{w×h×1} Rw×h×1在这里插入图片描述
最后,我们以相同的分辨率连接图像,以获得以下三个输入:在这里插入图片描述
所有这些输入都以其相应的尺度馈送到U形网络中。

MUCNN

网络架构如图4所示。它由特征提取路径(左侧)和重构路径(右侧)组成。提取路径有两个步骤,每个步骤包含一个3 × 3卷积,一个整流线性单元(ReLU)和一个最大池化操作。在每个步骤之间,在最大池化之后连接新的输入。对于重建路径,它由三个步骤组成,每个步骤包含一个SSconv操作和一个3×3卷积。重建路径通过两个跳过连接和网络底部的3 × 3卷积与提取路径连接,更多细节请参见图4。在这里插入图片描述
为了加速反向传播并促进网络学习丰富的特征层次,我们设置了三个3 × 3卷积以获得三个输出^MS R w × h × b R^{w×h×b} Rw×h×b,^MS R 2 w × 2 h × b R^{2w×2h×b} R2w×2h×b和^MS R 4 w × 4 h × b R^{4 w × 4h ×b} R4w×4h×b,而^MS是所需的HR-MS图像。总体而言,MUCNN可以总结如下:在这里插入图片描述

Mixed multiscale loss

提出了混合损失策略,以充分利用丰富的特征层次。在保证还原图像可靠的前提下,将三个输出与相应尺度的GT图像进行比较,形成最终的损失函数。通过线性插值得到低分辨率GT(GT2↓)和中分辨率GT(GT4↓)。最后,MUCNN的混合损失函数定义如下:在这里插入图片描述

结论

本文提出了带有SSconv的MUCNN,SSconv是专门为全色锐化而设计的。与现有技术的关键区别在于我们通过SSconv将光谱特征映射到空间域,使得MUCNN的特征提取更适合HR-PAN和LR-MS图像的融合。此外,引入多尺度注入分支,以消除LR-MS图像上采样引起的失真。我们选择U-Net作为构建MUCNN的骨干。此外,混合损耗策略用于分级控制输出。大量的实验表明,我们提出的方法不仅可以捕捉HR-PAN和LR-MS图像的底层细节,而且还具有强大的能力,以平衡空间恢复和光谱保存。
当然,我们的方法仍然存在一些缺点,特别是对于图像上的极端亮点。例如,来自车顶朝向传感器的太阳反射有时会像一群分散的星星一样变得尖锐,并失去车顶的原始轮廓。除此之外,有时像素噪声点将出现在实心区域中。通过实验,我们发现几乎所有基于DL的方法都存在类似的边缘不均匀问题,而传统方法没有。这个缺点提醒我们寻找传统方法的特点,并将它们与基于DL的方法相结合。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/5053.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

HTML5 Web 存储

HTML5 Web 存储 在HTML5之前,主要是使用cookies存储,cookies的缺点有:需要在请求头上带着数据,存储大小不过,在4k之内。本节, HTML5 web 存储,一个比cookie更好的本地存储方式。 什么是 HTML5 …

Redis技术详解

Redis技术详解 Redis是一种支持key-value等多种数据结构的存储系统。可用于缓存,事件发布或订阅,高速队列等场景。支持网络,提供字符串,哈希,列表,队列,集合结构直接存取,基于内存&…

Proxmox VE 超融合集群虚拟的NFS服务性能很差的问题解决

作者:田逸(formyz) 场景描述 五节点Proxmox VE集群,万兆网络,数据网络与存储网络独立,接口两两bond,交换机堆叠。 单机配置两颗AMD 宵龙CPU,核心数48,单台线程数192,单台…

服务器版RstudioServer安装与配置详细教程

Docker部署Rstudio server 背景:如果您想在服务器上运行RstudioServer,可以按照如下方法进行操作,笔者测试时使用腾讯云服务器(系统centos7),需要在管理员权限下运行 Rstudio 官方提供了使用不同 R 版本的 …

Baumer工业相机中偏振相机如何使用Baumer堡盟GAPI SDK来进行偏振数据的计算转换输出(C++)

项目场景 Baumer工业相机堡盟相机是一种高性能、高质量的工业相机,可用于各种应用场景,如物体检测、计数和识别、运动分析和图像处理。 Baumer的万兆网相机拥有出色的图像处理性能,可以实时传输高分辨率图像。此外,该相机还具…

【ansible】管理变量与事实详解

目录 管理变量与事实 一,变量 1,变量命名 2,变量优先级(高--低) 3,命令行引用 4, 引用playbook中的变量 5, 在主机清单中定义变量 6, 在自定义变量文件中定义变量 7&…

Linux基础IO - 文件描述符、重定向

前面的文章中我们讲述了C语言中文件相关的操作与系统文件IO的接口,这篇文章中将会讲述文件描述符与重定向的知识。 运行在前文中的系统文件程序,通过观察可以看到图中的数据3非常的奇怪没头没尾的,下面我们就来从这里开始。 通过查看man手册…

console使用方法介绍

console是在写前端Javascript时经常会使用到,我平时使用最多的是console.log,相比大多数人也是如此吧! 下面一起来看一下强大的console吧! 01函数(属性) 包含如下函数 / 属性:memory、assert、c…

Hadoop三大框架之HDFS

一、概述HDFS产生的背景及定义HDFS产生背景随着数据量越来越大,在一个操作系统存不下所有的数据,那么就分配到更多的操作系统管理的磁盘中,但是不方便管理和维护,需要一种系统来管理多台机器上的文件,这就是分布式文件…

日入500+的程序员都在用的“接私活”平台

网上总说程序员的薪资很高,这我可就不同意了: 程序员的薪资哪里是很高,而是非常高!而会接私活的程序员更是能拿到更高的收入!作为一个程序员,这些接私活的网站一定要收藏起来,让你在“八小时外…

ChatGPT transformer 5篇经典论文以及代码和解读

一次性读懂ChatGPT的技术演进路线,根据李沐老师推荐的5篇经典论文,整理了论文原文、论文解读、Github代码实现。 2017Transformer继MLP、CNN、RNN后的第四大类架构2018GPT使用 Transformer 解码器来做预训练2018BERTTransformer一统NLP的开始2019GPT-2更…

区块链概论

目录 1.概述 2.密码学原理 2.1.hash函数 2.2.签名 3.数据结构 3.1.区块结构 3.2.hash pointer 3.3.merkle tree 3.3.1.概述 3.3.2.证明数据存在 3.3.3.证明数据不存在 4.比特币的共识协议 4.1.概述 4.2.验证有效性 4.2.1.验证交易有效性 4.2.2.验证节点有效性 …

YOLOv5源码逐行超详细注释与解读(6)——网络结构(1)yolo.py

前言 在上一篇中,我们简单介绍了YOLOv5的配置文件之一 yolov5s.yaml,这个文件中涉及很多参数,它们的调用会在这篇 yolo.py 和下一篇 common.py 中具体实现。 本篇我们会介绍 yolo.py,这是YOLO的特定模块,和网络构建有…

python【selenium的环境配置】

selenium 1.环境配置 1)在环境设置里面安装selenium第三方库 pip install --user selenium2) from selenium.webdriver import Chrome# 创建谷歌 b Chrome() # 获取网页 b.get(http://www.baidu.com) # 防止自动关闭 input()3)在此之前&…

Rancher系列文章-Rancher v2.6使用脚本实现导入集群

概述 最近在玩 Rancher, 先从最基本的功能玩起, 目前有几个已经搭建好的 K8S 集群, 需要批量导入, 发现官网已经有批量导入的文档了. 根据 Rancher v2.6 进行验证微调后总结经验. 1. Rancher UI 获取创建集群参数 访问Rancher_URL/v3/clusters/,单击右上角“Crea…

第07章_单行函数

第07章_单行函数 🏠个人主页:shark-Gao 🧑个人简介:大家好,我是shark-Gao,一个想要与大家共同进步的男人😉😉 🎉目前状况:23届毕业生,目前在某…

进程地址空间+环境变量

目录 环境变量 进程地址空间 理解虚拟地址空间 进程地址空间区域划分 虚拟内存和物理内存建立联系 深刻理解虚拟地址空间 环境变量 当我们需要使用一个物品的时候,首先要先找到这个物品。同样的,当要运行一个程序(指令)时&a…

大公司为什么禁止SpringBoot项目用Tomcat?

前言 在SpringBoot框架中,我们使用最多的是Tomcat,这是SpringBoot默认的容器技术,而且是内嵌式的Tomcat。同时,SpringBoot也支持Undertow容器,我们可以很方便的用Undertow替换Tomcat,而Undertow的性能和内…

低功耗技术——流水线设计(加法器和乘法器)

文章目录前言一、流水线1、16bit加法器2、无符号4bit乘法器3、编写一个4bit乘法器模块,并例化该乘法器求解c12*a5*b二、降低FPGA功耗1、静态功耗2、动态功耗前言 2023.3.31 今天学习降低功耗的一些方法 一、流水线 电路最高工作频率:取决于最长的组合逻…

Windows下的详细Git安装

网址链接: Githttps://git-scm.com/ 下载后得到这个程序: 这里它给出的是使用Vim, 我改成的是VSCode: 第一种是让 Git 自己选择,名字是 master ,但是未来也有可能会改为其他名字; 第二种是我们自行决定&a…
最新文章