ShadowFormer:Global Context Helps Images Shadow Removal

本论文主要是对图像阴影去除工作的研究。现有工作都是针对于局部阴影或阴影部分分别进行优化,这就会导致在分界线上有明显不同(光照不一致,伪影情况)。因此,本文提出一种全局优化算法shandowFormer来解决分界不一致问题。

文章目录

  • 背景介绍
  • 挑战和动机
  • 贡献
  • Retinex-based Shadow Model
  • ShadowForm
    • 整体架构
    • 模型组件
  • 实验
    • 验证集性能
    • 现实场景

背景介绍

阴影,在图像中是一种很常见的元素,只要有光照就会有阴影。
在这里插入图片描述

在美学领域,光影必不可少,它会让图像看起来更加有意境。但对于 AI 来说,阴影很有可能会影响判断,比如物体检测时将阴影视为物体。目前的阴影去除技术分成两类:物理建模技术和深度学习技术。物理建模是将现实场景进行建模,然后进行求解。虽然这样会有很强的可解释性,但并不适合现实应用。而深度学习技术则是利用神经网络模型进行学习推理,准确度非常高。

挑战和动机

相较于传统图像恢复任务相比,阴影去除任务的挑战在于:

  • 阴影模式多样性:同一物体对应多个阴影模式
  • 阴影退化后,阴影区和非阴影区光照和颜色不一致

目前大多数工作都集中于第一个类,而且生成的图像并不会保留原始的光照和颜色信息。这导致生成图像会损失掉很多原图像信息。

贡献

  • Retinex-based shadow model:对问题进行数学建模
  • ShadowFormer
  • Shadow-Interaction Module:描述阴影区域和非阴影区域相关性
  • 实验证明,ShadowFormer实现sota效果。

Retinex-based Shadow Model

图像 I s I_s Is 由非阴影部分和阴影部分组成。
I s = I m ∘ I s + ( 1 − I m ) ∘ I n s I_s = I_m \circ I_s + (1 - I_m) \circ I_{ns} Is=ImIs+(1Im)Ins
阴影去除任务通过调整图像光照和颜色来达到消除阴影的效果。因此,论文引入 I s f = L s f ∘ R I_{sf}=L_{sf}\circ R Isf=LsfR(retinex 模型)从而使模型和光照和颜色挂钩。

I s = I m ∘ L s ∘ R + ( 1 − I m ) ∘ L n s ∘ R I_s = I_m \circ L_{s}\circ R + (1 - I_m) \circ L_{ns}\circ R Is=ImLsR+(1Im)LnsR

ShadowForm

根据以上模型公式,论文提出两个目标:

  • 模型感受野一定要大
  • 非阴影区域的光照信息对于阴影恢复来说非常重要

整体架构

ShadowFormer网络架构

图1. ShadowFormer网络架构

该模型通过 Channel Attention Modules 提取图像中的语义信息。在瓶颈阶段,模型利用非阴影区域的空间和通道维度的上下文信息(Shadow-Interaction Module)来帮助阴影区域恢复。最后,模型进入Decoder阶段,从而输出无阴影图像。

模型组件

在这里插入图片描述

图3. ShadowFormer模型组件


  • (a) 在编码器和解码器中的 Channel Attention(CA) 模块。
  • (b) Shadow-Interaction Module(SIM) 模块:通过对阴影和非阴影部分的相关性图重新加权计算图,以强调阴影和非阴影区域之间的上下文相关性。

实验

验证集性能

  • 在 ISTD 数据集上,各种模型生成的无阴影图像量化结果
    在这里插入图片描述

  • 在 SRD 数据集上,各种模型生成的无阴影图像量化结果
    在这里插入图片描述

  • 在 ISTD+ 数据集上,各种模型生成的无阴影图像量化结果
    在这里插入图片描述

现实场景

  • 现实场景下,各类模型性能比对
    在这里插入图片描述

  • 消融实验

在这里插入图片描述

  • 保留信息

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/554039.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Springboot+Vue项目-基于Java+MySQL的企业客户管理系统(附源码+演示视频+LW)

大家好!我是程序猿老A,感谢您阅读本文,欢迎一键三连哦。 💞当前专栏:Java毕业设计 精彩专栏推荐👇🏻👇🏻👇🏻 🎀 Python毕业设计 &…

数据结构中的顺序表的删除和查找

对于顺序表,它包括:初始化,取值,查找,插入,以及删除。接下来就讲一讲删除和查找。 删除:它包括头删和尾删,为什么顺序表中要用到删除呢?按我的理解就是:为插入…

SRIO系列-基本概念及IP核使用

参考:串行RapidIO: 高性能嵌入式互连技术 | 德州仪器 SRIO协议技术分析 - 知乎 PG007 目录 一、SRIO介绍 1.1 概要 1.2 SRIO与传统互联方式的比较 1.3 串行SRIO标准 1.4 SRIO层次结构: 1.4.1 逻辑层 1.4.2 传输层协议 1.4.3 物理层 二、Xilinx…

内网隧道技术总结

隧道技术解决的是网络通信问题,因为在内网环境下,我们不同的内网主机管理员会进行不同的网络配置,我们就需要使用不同的方式去控制我们的内网主机。隧道技术是一个后渗透的过程,是可以是我们已经取得了一定的权限,在这…

【Visual Studio 2012中文版】下载安装以及使用方法

文章目录 前言一、下载安装包二、安装步骤1.双击VS2012_ULT_chs.iso文件打开2.双击vs_ultimate.exe打开安装程序3.选择要安装的功能4.软件正在安装,请耐心等待10分钟5.安装成功,点击“启动”6.激活码(产品密钥) 三、VS2012使用&am…

软考 系统架构设计师系列知识点之大数据设计理论与实践(10)

接前一篇文章:软考 系统架构设计师系列知识点之大数据设计理论与实践(9) 所属章节: 第19章. 大数据架构设计理论与实践 第3节 Lambda架构 19.3.5 Lambda架构优缺点 1. 优点 (1)容错性好 Lambda架构为大数…

HTML:Form表单控件主要标签及属性。name属性,value属性,id属性详解。表单内容的传递流程,get和post数据传递样式。表单数据传递实例

form表单 <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><title>Document</title> </head> &…

Vue源码解读学习

Vue源码 观察者模式 & 发布订阅 观察者模式&#xff1a;中心一对多 系统单点间的灵活和拓展&#xff08;广播的方式&#xff09; 发布订阅&#xff1a;将注册列表遍历发布给订阅者 initInject initState initProvide他们挂载顺序为什么这样设计&#xff1f; initstate…

【春秋云镜】CVE-2023-43291 emlog SQL注入

靶场介绍 emlog是一款轻量级博客及CMS建站系统&#xff0c;在emlog pro v.2.1.15及更早版本中的不受信任数据反序列化允许远程攻击者通过cache.php组件执行SQL语句。 不感兴趣的可以直接拉到最后面&#xff0c;直接获取flag 备注&#xff1a;没有通过sql注入获取到flag&…

C语言 【基础语法】

一、编程环境搭建 编译器&#xff1a;gcc 集成开发环境&#xff1a;vscode 1.1 安装vscode 1.2 设置中文包 插件 1.3 设置C/C扩展 安装 C/C Compile Run extension 和 C/C Extension Pack 扩展 二、基础语法 2.1 第一个c语言程序 2.2 数据类型 2.2.1 变量的语法(重点) …

RK3588 Android13 TvSetting 中增加 Usb 模式 Host/OTG 切换

前言 电视产品,客户要求在设置中设备偏好设置子菜单下增加一个USB模式切换菜单,一开始准备直接开整。但发现在开发者选项里就已经包含了一个USB模式 菜单了,只是没有 OTG HOST 这两选项,那就把这个菜单挪出来再增加一下就完事了,开整。 客户提供对比机图 效果图 framew…

OpenCV从入门到精通实战(六)——多目标追踪

基于原生的追踪 使用OpenCV库实现基于视频的对象追踪。通过以下步骤和Python代码&#xff0c;您将能够选择不同的追踪器&#xff0c;并对视频中的对象进行实时追踪。 步骤 1: 导入必要的库 首先&#xff0c;我们需要导入一些必要的Python库&#xff0c;包括argparse、time、…

Redis从入门到精通(十四)Redis分布式缓存(二)Redis哨兵集群的搭建和原理分析

文章目录 前言5.3 Redis哨兵5.3.1 哨兵原理5.3.1.1 集群的结构和作用5.3.1.2 集群监控原理5.3.1.3 集群故障恢复原理 5.3.2 搭建哨兵集群5.3.3 RedisTemplate5.3.3.1 搭建测试项目5.3.3.2 场景测试 前言 Redis分布式缓存系列文章&#xff1a; Redis从入门到精通(十三)Redis分…

回文链表题解

题目&#xff1a;回文链表 分析 这道题目标签为简单题&#xff0c;但是如果要实现下面的进阶过程不是很简单。 拿到题目一般来说就是赶时间&#xff0c;没有要求的情况下直接使用一个列表存储所有的数值&#xff0c;然后判断这个列表是否满足回文&#xff0c;这个思路是比较简…

【1524】java投票管理系统Myeclipse开发mysql数据库web结构java编程计算机网页项目

一、源码特点 java 投票管理系统是一套完善的java web信息管理系统&#xff0c;对理解JSP java编程开发语言有帮助&#xff0c;系统具有完整的源代码和数据库&#xff0c;系统主要采用B/S模式开发。开发环境为TOMCAT7.0,Myeclipse8.5开发&#xff0c;数据库为Mysql5.0&…

IO引脚服用和映射

什么是端口复用 STM32F4 有很多的内置外设&#xff0c;这些外设的外部引脚都是与 GPIO 复用的。也就是说&#xff0c;一个 GPIO如果可以复用为内置外设的功能引脚&#xff0c;那么当这个 GPIO 作为内置外设使用的时候&#xff0c;就叫做复用。在芯片数据手册或STM32F4XX参考手…

传感器融合 | 适用于自动驾驶场景的激光雷达传感器融合项目_将激光雷达的高分辨率成像+测量物体速度的能力相结合

项目应用场景 面向自动驾驶场景的激光雷达传感器融合&#xff0c;将激光雷达的高分辨率成像测量物体速度的能力相结合&#xff0c;项目是一个从多个传感器获取数据并将其组合起来的过程&#xff0c;可以更加好地进行环境感知。项目支持 ubuntu、mac 和 windows 平台。 项目效果…

ASP.NET基于TCP协议的简单即时通信软件的设计与实现

摘 要 即时通信(Instant Message)&#xff0c;由于其具有实时性、跨平台性、成本低、效率高等优点而受到广泛的使用。设计并实现一个能够处理多用户进行实时、安全的即时通信系统具有较强的现实意义。即时通信的底层通信是通过SOCKET套接字接口实现的。当前的主流UNIX系统和微…

Android --- Activity

官方文档-activity Activity 提供窗口&#xff0c;供应在其中多个界面。此窗口通常会填满屏幕&#xff0c;但也可能小于屏幕并浮动在其他窗口之上。 大多数应用包含多个屏幕&#xff0c;这意味着它们包含多个 Activity。通常&#xff0c;应用中的一个 Activity 会被指定主 Ac…

Linux数据库自动备份 - 定时任务发到百度云盘、坚果云、邮箱附件

前言 1. 坚果云的webdav云盘最好&#xff01; &#xff08;免费账号每月1G上传流量&#xff09; 2. 不建议数据库备份文件发送到SMTP邮箱&#xff0c;因为对方服务器非常容易当做垃圾邮件处理&#xff0c;而且发信的SMTP账号会被封禁&#xff08;实测163发到QQ邮箱被封&…