论文阅读笔记 | MetaIQA: Deep Meta-learning for No-Reference Image Quality Assessment

文章目录

    • 文章题目
    • 发表年限
    • 期刊/会议名称
    • 论文简要
    • 动机
    • 主要思想或方法架构
    • 实验结果

文章链接:https://doi.org/10.48550/arXiv.2004.05508

文章题目

MetaIQA: Deep Meta-learning for No-Reference Image Quality Assessment

发表年限

2020

期刊/会议名称

Published in: 2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR)

论文简要

  • 本文提出了一种基于深度元学习的 NR-IQA 指标。其基本思想是学习人类在评估具有各种失真的图像质量时所共享的元知识,然后可以轻松地适应未知的失真。
  • 首先作者收集了针对不同失真的多个 NR-IQA 任务,然后采用元学习来学习不同失真共享的先验知识。
  • 最后,在目标 NR-IQA 任务上对质量先验模型进行微调,以快速获得质量模型。
  • 广泛的实验证明,所提出的指标在很大程度上优于现有技术水平。此外,从合成失真中学习的元模型也可以轻松推广到真实失真,这在IQA指标的实际应用中是非常理想的。

动机

  • 训练 DCNNs 严重依赖于大量带注释的数据。由于通过人工标注图像质量非常昂贵且耗时,因此收集大规模的图像质量数据来训练 DCNNs 的 IQA 模型是困难的。IQA 是一个典型的小样本问题。现有注释的 IQA 数据库的规模通常是有限的,因此直接使用这些数据库来训练深度 IQA 模型很容易导致过拟合问题。
  • 大多数现有的基于深度卷积神经网络 DCNNs 的 IQA 指标都是基于预训练的网络运行的。这些预训练的网络不是为 IQA 任务设计的,会导致模型在评估不同类型的图像退化时出现泛化问题。预训练模型并不是为 IQA 任务设计的,因此它们无法轻松适应新类型的失真。
  • 在现实世界的情况下,人类可以轻松从具有各种失真的图像中获得质量先验知识并快速适应对未知失真图像的质量评估,因此对于 NR-IQA 方法来说,学习人类在评估具有各种失真的图像质量时的共享先验知识至关重要。

主要思想或方法架构

在这里插入图片描述

  • 作者通过一些已知失真类型的 NR-IQA 任务来学习一个共享的质量先验模型,然后针对未知失真的 NR-IQA 任务进行微调。方法的整体框架如图所示,包括两个步骤,即质量先验模型的元训练和未知失真的 NR-IQA 的微调。
  • 在第一步中,作者利用一些特定失真的 NR-IQA 任务建立一个元训练集,进一步将其分为支持集和查询集两个子集。然后使用从支持集到查询集的双层梯度下降方法来学习质量先验模型。
  • 深度回归网络由卷积层和全连接层组成。卷积层来自于一个常用的深度网络,作者采用全局平均池化(GAP)操作来生成全连接层。然后,作者添加另一个全连接层来生成作者深度回归网络的输出。
  • 特别地,对于输入图像 x x x,作者将其输入深度网络,生成图像的预测质量分数 y ~ \tilde{y} y~,定义为:

在这里插入图片描述

  • 其中 θ θ θ 为初始化后的模型参数。作者使用欧氏距离的平方作为损失函数,其形式如下

在这里插入图片描述

  • 其中 y y y 为输入图像 x x x g r o u n d − t r u t h ground-truth groundtruth 质量分数。
  • 从许多特定失真的 NR-IQA 任务中获得元训练集 。

在这里插入图片描述

  • 其中, D s P ( τ ) {D_s}^{P(τ)} DsP(τ) D q P ( τ ) {D_q}^{P(τ)} DqP(τ) 分别是每个任务的支持集和查询集, N N N 是总任务数。
  • 为了捕捉不同 NR-IQA 任务之间的通用模型,作者从元训练集中随机抽取 k k k 个任务作为一个小批次( 1 1 1 < k k k N N N)。
  • 对于小批次中第 i i i 个支持集 ,可通过欧氏距离的平方 L \mathcal{L} L 计算损失,并表示为 L τ i {\mathcal{L}}_{τi} Lτi i i i ∈ \in { 1 , 2 , . . . , k 1,2,...,k 1,2,...,k})。
  • 作者利用更高效的随机梯度下降 S G D SGD SGD 方法来优化模型。
  • 首先计算与所有模型参数相关的损失函数 L τ i \mathcal{L}_{τi} Lτi 的一阶梯度,并定义为:

在这里插入图片描述

  • 接下来,作者使用 A d a m Adam Adam 优化器在支持集 D s τ i {D_s}^{τi} Dsτi i i i = = = 1 , 2 , . . . , k 1,2,...,k 1,2,...,k)上对模型参数进行 S S S 步更新。
  • A d a m Adam Adam 优化器的定义如下:

在这里插入图片描述

  • ε = 1 e − 8 ε = 1e−8 ε=1e8
  • α α α 是内部学习率。
  • m θ ( s ) m_{θ(s)} mθ(s) v θ ( s ) v_{θ(s)} vθ(s) 分别表示梯度的一阶和二阶原始矩,定义如下:

在这里插入图片描述

  • 其中 m θ ( s ) = 0 m_{θ(s)} = 0 mθ(s)=0 v θ ( s ) = 0 v_{θ(s)} = 0 vθ(s)=0
  • μ 1 μ_1 μ1 μ 2 μ_2 μ2 m θ ( s ) m_{θ(s)} mθ(s) v θ ( s ) v_{θ(s)} vθ(s) 的指数衰减率。
  • g θ ( s ) g_{θ(s)} gθ(s) 表示第 s s s 步中更新后的梯度 。
  • 模型参数 θ ′ i {θ^{'}}_i θi 可以通过 A d a m Adam Adam 优化器在查询集 D q τ i {D_q}^{τi} Dqτi i i i = = = 1 , 2 , . . . , k 1,2,...,k 1,2,...,k)上进行 S S S 步更新,具体形式如下:

在这里插入图片描述

  • 这里的 m θ ′ ( s ) m_{{θ^{'}}(s)} mθ(s) v θ ′ ( s ) v_{{θ^{'}}(s)} vθ(s) 分别表示梯度的一阶和二阶原始矩。
  • 对于 k k k 个任务的小批次处理,所有任务的梯度被整合以更新最终的模型参数,定义如下:

在这里插入图片描述

  • 其中 β β β 是外部学习率。
  • 通过这种方法,作者在元训练集 D p ( τ ) m e t a {D^{p(τ)}}_{meta} Dp(τ)meta 上迭代地对 k k k 个 NR-IQA 任务进行采样来训练深度回归网络 f θ f_θ fθ
  • 最终,通过双层梯度优化的元学习可以获得适用于各种图像失真的质量先验模型。
  • 在第二步中,作者在目标 NR-IQA 任务上对质量先验模型进行微调,以获得质量模型。
  • 在对于未知失真的微调中,在从若干特定失真的 NR-IQA 任务中训练质量先验模型后,作者将使用该模型作为先验知识,在具有未知失真的 NR-IQA 任务上进行微调。
  • 对于来自目标 NR-IQA 任务的 M M M 张训练图像,并带有注释的质量分数,作者对于第 i i i 张图像的预测分数和真实分数使用欧氏距离的平方作为损失函数,其定义如下:

在这里插入图片描述

  • 然后,作者利用 A d a m Adam Adam 优化器在 NR-IQA 任务上对质量先验模型进行 P P P 步的更新,定义如下:

在这里插入图片描述

  • 其中 α f α_f αf 是微调的学习率。 m θ ( p ) m_{θ(p)} mθ(p) v θ ( p ) v_{θ(p)} vθ(p) 分别表示梯度的一阶和二阶原始矩。

  • 最终,可以获得用于评估具有未知失真图像质量的质量模型。

  • 值得注意的是作者提到他所提出的方法的微调过程不需要学习额外的参数,这极大地提高了学习效率,并增强了模型的泛化能力。

实验结果

  • 为了验证作者提出的元模型对未知失真的泛化性能,作者通过在 T I D 2013 TID2013 TID2013 K A D I D KADID KADID- 10 K 10K 10K 数据库上使用留一失真交叉验证,将所提出的方法与六种最先进的通用 NR-IQA 方法进行了比较。

在这里插入图片描述

  • 表中列出了所提出的方法和最先进的 NR-IQA 方法的测试 S R O C C SROCC SROCC 值,每种失真类型的最佳结果以粗体标记。
  • 可以看到,作者提出的方法在两个数据库上的总体性能(平均结果)都大大优于其他方法。
  • 在TID2013数据库中,作者提出的方法对超过一半的失真类型的SROCC值大于 0.9 0.9 0.9,这表明提出的基于元学习的 NR-IQA 方法可以有效地学习共享质量先验模型,并快速适应未知失真类型的 NR-IQA 任务。

在这里插入图片描述

  • 为了进一步研究所提出的方法的有效性是否来源于元学习,作者进行了消融实验。
  • 基线方法是首先直接使用 A d a m Adam Adam 优化器在特定畸变的图像上训练网络模型,然后在真实畸变图像的训练集上对模型进行微调。
  • 与基线方法相比, M e t a I Q A MetaIQA MetaIQA 具有更好的泛化性能,可以在不改变网络结构的情况下提高 NR-IQA 模型的性能。

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/443190.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

vue router 解决路由带参数跳转时出现404问题

我的页面是从一个vue页面router跳转到另一个vue页面&#xff0c;并且利用windows.open() 浏览器重新创建一个页签。但是不知道为什么有时候可以有时候又不行&#xff0c;经过反复测试与分析&#xff0c;最终发现是因为有一个参数的值里包含了小数点., 小数点是浏览器合法字符&a…

visualization_msgs::Marker 的pose设置,map坐标系的3d box显示问题

3D框显示 3D框显示可以使用visualization_msgs::Marker::LINE_LIST或者LINE_STRIP&#xff0c;前者使用方法需要指明线的两个端点&#xff0c;后者自动连接相邻两个点。 姿态问题 网上看了一些&#xff0c;没有涉及到朝向设置&#xff0c;Pose.orientation默认构造为4个0 至…

域控操作十:安装包exe转msi软件下发

需要的文件 Advanced Installer 软件用来将exe转换成msi因为域控只能下发msi格式 一个exe安装包这里拿微信举例 一个没有密码的共享文件夹 1.exe转MSI 2&#xff0c;开始下发 服务器和用户刷新策略 #完成

解决方案TypeError: string indices must be integers

文章目录 一、现象&#xff1a;二、解决方案 一、现象&#xff1a; PyTorch深度学习框架&#xff0c;运行bert-mini&#xff0c;本地环境是torch1.4-gpu&#xff0c;发现报错显示&#xff1a;TypeError: string indices must be integers 后面报字符问题&#xff0c;百度过找…

【附教程】2024,人工智能+声音,看这里就够了~16款AI音乐/音频/音效,声音克隆等ai软件与工具大合集~

AI音乐音频领域的技术正在迅速发展&#xff0c;为音乐创作和编辑带来了革命性的改变。这些技术通过深度学习和生成式模型&#xff0c;能够理解并模仿音乐的复杂结构和情感&#xff0c;从而创作出高质量的音乐作品。 AI音乐音频技术使得音乐创作变得更加高效和便捷。创作者只需…

Unity DropDown 组件 详解

Unity版本 2022.3.13f1 Dropdown下拉菜单可以快速创建大量选项 一、 Dropwon属性详解 属性&#xff1a;功能&#xff1a;Interactable此组件是否接受输入&#xff1f;请参阅 Interactable。Transition确定控件以何种方式对用户操作进行可视化响应的属性。请参阅过渡选项。Nav…

CodeSys通过C函数接口调用Qt

建议先查看之前的文章【CodeSys中调用C语言写的动态库】&#xff0c;了解如何创建一个能够被codesys调用的动态库。 假如想要在函数中使用Qt或者第三方库&#xff08;比如opencv等&#xff09;&#xff0c;可以在其自动生成的makefile文件中设置好相应的参数。 比如我这里就是…

洗地机怎么选|洗地机哪款好用?添可、希亦、美的洗地机哪个最耐用质量好?

在现代生活中&#xff0c;屋内清洁是一项必不可少的工作&#xff0c;但也是一项费时费力的工作。随着科技的进步&#xff0c;家庭清洁工具也正经历着革命性的变革。洗地机&#xff0c;一种集吸尘、拖地、清洗于一体的智能家居清洁工具&#xff0c;正逐渐成为现代家庭必备的家电…

鸿蒙Harmony应用开发—ArkTS声明式开发(基础手势:ImageSpan)

Text组件的子组件&#xff0c;用于显示行内图片。 说明&#xff1a; 该组件从API Version 10开始支持。后续版本如有新增内容&#xff0c;则采用上角标单独标记该内容的起始版本。 子组件 无 接口 ImageSpan(value: ResourceStr | PixelMap) 参数&#xff1a; 参数名参数类…

后量子时代,未来密码该何去何从?

古有飞鸽&#xff0c;现有网络&#xff0c;在知识经济为基础的信息化社会中&#xff0c;保障网络信息安全无疑成为成为国与国之间无形的较量。小到个人通讯&#xff0c;大到机要信息传输&#xff0c;信息安全对于国家安全和经济活动正常运转至关重要。密码学作为保障网络与信息…

消息队列以及Kafka的使用

什么是消息队列 消息队列&#xff1a;一般我们会简称它为MQ(Message Queue)。其主要目的是通讯。 ps&#xff1a;消息队列是以日志的形式将数据顺序存储到磁盘当中。通常我们说从内存中IO读写数据的速度要快于从硬盘中IO读写的速度是对于随机的写入和读取。但是对于这种顺序存…

QGridLayout网格布局和QVBoxLayout垂直布局有着非常大的差别

QGridLayout网格布局&#xff1a;1.把这块控件划分成一个个的 单元格 2.把你的控件填充进入 单元格 3.这些有关限制大小的函数接口统统失效 setMaximumWidth&#xff08;&#xff09; setMinimumWidth() setPolicySize()图示&#xff1a;我是用的网格布局&#xff0c;左边放QT…

Vue.js数据绑定解密:深入探究v-model和v-bind的原理与应用

hello宝子们...我们是艾斯视觉擅长ui设计和前端开发10年经验&#xff01;希望我的分享能帮助到您&#xff01;如需帮助可以评论关注私信我们一起探讨&#xff01;致敬感谢感恩&#xff01; Vue.js数据绑定解密&#xff1a;深入探究v-model和v-bind的原理与应用 一、引言 Vue.…

智慧文旅|AI数字人导览:让旅游体验不再局限于传统

AI数字人导览作为一种创新的展示方式&#xff0c;已经逐渐成为了VR全景领域的一大亮点&#xff0c;不仅可以很好的嵌入在VR全景中&#xff0c;更是能够随时随地为观众提供一种声情并茂的讲解介绍&#xff0c;结合VR场景的沉浸式体验&#xff0c;让观众仿佛置身于真实场景之中&a…

音视频学习笔记——c++多线程(二)

✊✊✊&#x1f308;大家好&#xff01;本篇文章是多线程系列第二篇文章&#x1f607;。首先讲解了利用mutex解决多线程数据共享问题&#xff0c;举例更好理解lock和unlock的使用方法&#xff0c;以及错误操作造成的死锁问题&#xff0c;最后讲解了lock_guard与unique_lock使用…

PromptBreeder---针对特定领域演化和发展提示词的方法

原文地址&#xff1a;promptbreeder-evolves-adapts-prompts-for-a-given-domain 论文地址&#xff1a;https://arxiv.org/pdf/2309.16797.pdf 2023 年 10 月 6 日 提示方法分为两大类 硬提示是由人工精心设计的文本提示&#xff0c;包含离散的输入令牌&#xff1b;其缺点…

黑马点评-发布探店笔记

探店笔记 探店笔记类似点评网站的评价&#xff0c;往往是图文结合。 对应的表有两个&#xff1a; tb_blog&#xff1a;探店笔记表&#xff0c;包含笔记中的标题、文字、图片等 tb_blog_comments&#xff1a;其他用户对探店笔记的评价 流程如下&#xff1a; 上传接口&#…

基于SSM框架的动物医疗平台设计与实现

目 录 摘 要 I Abstract II 引 言 1 1 相关技术 3 1.1 Ajax 3 1.2 MVC设计模式 3 1.3 BootStrap 3 1.4 SSM框架 4 1.5 本章小结 4 2 系统分析 5 2.1 需求分析 5 2.1.1 用户需求分析 5 2.1.2 医生需求分析 6 2.1.3 管理员需求分析 7 2.2 用例分析 8 2.3 非功能需求 10 2.4 本章…

解决火狐浏览器访问地址受限制问题(This address is restricted)

问题如下图&#xff1a; This address is restrictedThis address uses a network port which is normally used for purposes other than Web browsing. Firefox has canceled the request for your protection. 此地址受到限制 此地址使用通常用于 Web 浏览以外的目的的网…

sort函数详解

往期文章推荐&#xff1a; [C] 非常实用的知识点-CSDN博客 1.8编程基础之多维数组————14:扫雷游戏地雷数计算-CSDN博客 &#xff08;并不怎么华丽的分割线&#xff09; 前言 话说在C中有这么一类算法&#xff0c;叫做排序算法。 它有许多分支&#xff1a;冒泡排序&a…
最新文章