9种卷积注意力机制创新方法汇总,含2024最新

今天咱们来聊聊卷积注意力机制

相信各位在写论文的时候都苦恼过怎么更好地改模型,怎么更高效地提高模型的性能和泛化能力吧?我的建议是,不妨考虑考虑卷积+注意力

卷积注意力机制是一种通过关注输入数据中的不同部分来改进模型性能的方法,结合了卷积网络和Transformer各自的优势,以同时获得更好的泛化能力和更大的模型容量。因此,通过将二者有效结合,卷积注意力机制就能帮助我们在准确性和效率之间实现更好的平衡。

今天我就帮同学们整理了卷积注意力机制3种创新思路,帮助想发论文的同学更高效地改模型涨点,早点发出自己的顶会。另外,每种思路我都整理了对应的论文和代码,方便同学们更好地理解这些创新思路是如何落地的。

论文和代码看文末

融合卷积与自注意力机制的新架构

DAS: A Deformable Attention to Capture Salient Information in CNNs

一种可变形的注意力机制,用于捕捉CNN中的显著信息

「简述:」CNN在图像识别中擅长处理局部空间模式,但有些重要的信息可能超出了CNN的识别范围。传统的自我注意力机制虽然能处理全局信息,但计算量大。论文提出了一种名为DAS的新方法。这种方法不仅简单、快速,而且能有效地捕捉相关图像区域的信息。与传统的注意力机制相比,DAS的计算量更小。实验表明,DAS可以显著提高CNN的性能,尤其是在图像分类和目标检测任务上。

X-volution: On the Unification of Convolution and Self-attention

关于卷积和自注意力的统一

「简述:」论文介绍了一种名为X-volution的方法,用于将卷积和自注意力统一起来。作者认为卷积和自注意力是深度神经网络中两个重要的构建块,但现有的架构缺乏一种方法来同时应用这两种操作。因此,作者提出了一个多分支基本模块,由卷积和自注意力操作组成,能够统一局部和非局部特征交互。经过训练后,这个多分支模块可以转换为单个标准卷积操作,称为X-volution,可以作为原子操作插入到任何现代网络中。

CoAtNet: Marrying Convolution and Attention for All Data Sizes

结合卷积和注意力处理各种数据规模

「简述:」论文介绍了一种名为CoAtNet的混合模型,用于结合卷积和注意力的优势。作者认为Transformers具有更大的模型容量,但由于缺乏正确的归纳偏置,其泛化能力可能不如卷积神经网络。为了有效地结合两种架构的优点,作者提出了CoAtNets,这是一类基于两个关键见解构建的混合模型:(1)深度卷积和自注意力可以通过简单的相对注意力自然地统一起来;(2)以合理的方式垂直堆叠卷积层和注意力层可以显著提高泛化能力、容量和效率。

UniFormer: Unified Transformer for Efficient Spatiotemporal Representation Learning

用于高效时空表示学习的统一的Transformer

「简述:」论文介绍了一种名为UniFormer的模型,用于从高维视频中学习丰富的多尺度时空语义。作者提出了一种新的方法,将3D卷积和视觉Transformer结合起来,以解决视频帧之间的局部冗余和全局依赖关系问题。通过在浅层和深层分别学习局部和全局令牌亲和力,UniFormer能够有效地捕获长距离依赖并减少局部冗余。实验表明,UniFormer在流行的视频基准上取得了最先进的性能,同时需要更少的计算资源。

开发动态和自适应的注意力卷积方法

Dynamic Convolution: Attention over Convolution Kernels

卷积核上的注意力机制

「简述:」动态卷积是一种轻量级的卷积神经网络设计,通过动态聚合多个并行卷积核来增加模型复杂度,从而提高性能。它不需要增加网络深度或宽度,同时具有计算效率高和表示能力强等优点。在ImageNet分类任务上,使用动态卷积可以将MobileNetV3-Small的top-1准确率提高2.9%,同时仅增加了4%的额外FLOPs。

Omni-Dimensional Dynamic Convolution

全维动态卷积

「简述:」全维动态卷积(ODConv)是一种轻量级的卷积神经网络设计,通过学习多个并行卷积核的线性组合来提高性能。与现有的研究不同,ODConv关注所有四个维度(即每个卷积核的空间大小、输入通道数和输出通道数)的卷积核空间,并利用一种新的多维注意力机制和并行策略来学习互补的注意力。作为常规卷积的替代品,ODConv可以插入到许多CNN架构中。在ImageNet和MS-COCO数据集上的实验表明,ODConv为各种流行的CNN骨干网络带来了可靠的准确率提升,同时减少了额外参数。

多尺度注意力卷积网络

EPSANet: An Efficient Pyramid Squeeze Attention Block on Convolutional Neural Network

一种高效的金字塔压缩注意力块卷积神经网络

「简述:」论文提出了一种名为金字塔挤压注意力(PSA)的轻量级有效注意力方法,并将其嵌入深度卷积神经网络中以提高性能。通过在ResNet的瓶颈块中使用PSA模块替换3x3卷积,得到了一种新的表示性块,称为高效金字塔挤压注意力(EPSA)块。EPSA块可以很容易地作为一个即插即用组件添加到成熟的骨干网络中,并显著提高模型性能。因此,作者通过堆叠这些ResNet风格的EPSA块开发了一种简单而高效的骨干架构,称为EPSANet。所提出的EPSANet可以为各种计算机视觉任务提供更强的多尺度表示能力,包括但不限于图像分类、目标检测、实例分割等。

SegNeXt: Rethinking Convolutional Attention Design for Semantic Segmentation

重新思考用于语义分割的卷积注意力设计

「简述:」SegNeXt是一个用于语义分割的简单卷积网络架构。它重新审视了成功分割模型的特征,发现了一些关键组件,这些组件有助于提高分割模型的性能。这些关键组件包括卷积注意力和廉价的卷积操作。基于这些发现,作者设计了一种新型的卷积注意力网络,称为SegNeXt。SegNeXt在流行的基准测试中显著提高了分割模型的性能,并使用更少的参数达到了与EfficientNet-L2 w/ NAS-FPN相当的性能。

DMSANet: Dual Multi Scale Attention Network

双重多尺度注意力网络

「简述:」论文提出了一种新的轻量级注意力模块,可以很容易地集成到其他卷积神经网络中。所提出的DMSANet网络由两部分构成:一部分用于提取不同尺度的特征并聚合它们,另一部分使用空间和通道注意力模块来自适应地将局部特征与其全局依赖关系整合在一起。在ImageNet数据集上进行图像分类基准测试,并在MS COCO数据集上进行目标检测和实例分割。

关注下方《学姐带你玩AI》🚀🚀🚀

回复“卷积注意力”获取论文+代码合集

码字不易,欢迎大家点赞评论收藏

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/281142.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

《Linux系统与网络管理》复习题库---shell编程题

1、shell 编程题:在根目录下有四个文件 m1.c,m2.c,m3.c,m4.c,用 Shell 编程,实现自动创建 m1,m2,m3,m4 四个目录,并将 m1.c,m2.c,m3.c,m4.c 四个文件分别剪贴到各自相应的目录下。 #!/bin/bash…

Termius for Mac/Win:一站式终端模拟器、SSH 和 SFTP 客户端软件的卓越选择

随着远程工作和云技术的普及,对于高效安全的远程访问和管理服务器变得至关重要。Termius,一款强大且易用的终端模拟器、SSH 和 SFTP 客户端软件,正是满足这一需求的理想选择。 Termius 提供了一站式的解决方案,允许用户通过单一平…

英语长难句分享第十五天解析

群公告 长难句分享第十五天解析 【词汇】: • mispredict [ˌmɪsprɪˈdɪkt] v. 错误预测 • mechanical [məˈknɪkl] adj. 机械的 • everyday [ˈevrideɪ] adj. 日常的 • helicopter [ˈhelɪkɑːptər] n. 直升机 • eventually [ɪˈventʃuəli] adv. …

AI 开发必看的 6 款开源矢量数据库

你好,我是坚持分享干货的 EarlGrey,翻译出版过《Python编程无师自通》、《Python并行计算手册》等技术书籍。 如果我的分享对你有帮助,请关注我,一起向上进击。 创作不易,希望大家给一点鼓励,把公众号设置为…

starrocks集群fe/be节点进程守护脚本

自建starrocks集群,有时候服务会挂掉,无法自动拉起服务,于是采用supervisor进行进程守护。可能是版本的原因,supervisor程序总是异常,无法对fe//be进行守护。于是写了个简易脚本。 #!/bin/bash AppNameFecom.starrock…

jmeter接口测试02

jmeter接口测试02 新增测试计划用户自定义变量http请求默认值http头部管理器线程组HTTP请求HTTP响应断言 创建查看结果树和总结报告启动线程组,查看结果树和总结报告 新增测试计划 用户自定义变量 定义测试计划常用的变量 例如token、接口的ip、端口等。 http请求…

cargo(rust包管理) 常见命令、包检索 (windows+linux)

rust环境和开发环境配置:rust开发环境配置 winlinux Cargo是Rust的构建系统和包管理器。 如果你的能力足够强也愿意,可以不用cargo进行rust开发,即从头开始敲代码 一、cargo包相关查询 1.查找包 查找cargo包链接:crates.io …

视频编辑与制作,视频尺寸修改器

你是否曾因为视频尺寸与平台不匹配无法上传而烦恼?这个时候一款视频尺寸修改工具,就能帮你轻松搞定。不论是为了适应不同的平台要求,还是为了获得不一样的观看体验,【视频剪辑高手】都能为你提供完美的解决方案。 所需工具&#…

layui表格中预览视频和图片

全代码 <!DOCTYPE html> <html><head><title>Layui&#xff1a;数据表格table中预览图片、视频</title><meta charset"utf-8"/><link rel"stylesheet" href"../dist/css/layui.css"><style>&l…

Python 下载与安装

1、下载 打开Python官网&#xff1a;Welcome to Python.org 点击下图所示的【Downloads】按钮进入下载页面。 ​ 进入下载页面后下拉至下图位置&#xff0c;选择版本&#xff0c;点击下载按钮下载。 页面会跳转至下一页下载页面&#xff0c;下拉到下图位置&#xff0c;选择…

【实用工具】Gradio快速部署深度学习应用1:图像分类

前言 在AI快速发展的今天&#xff0c;我们作为算法开发人员&#xff0c;也应该有一些趁手的工具帮助我们快速开发并验证自己的想法&#xff0c;Gradio可以实现快速搭建和共享的功能&#xff0c;能够展示出一个前端界面&#xff0c;把我们的算法包裹起来&#xff0c;快速验证算…

(JAVA)-(网络编程)-初始网络编程

网络编程就是在通信协议下&#xff0c;不同的计算机上运行的程序&#xff0c;进行的数据传输。 讲的通俗一点&#xff0c;就是以前我们写的代码是单机版的&#xff0c;网络编程就是联机版的。 应用场景&#xff1a;即时通信&#xff0c;网游对战&#xff0c;金融证券&#xf…

用通俗易懂的方式讲解大模型:使用 LangChain 封装自定义的 LLM,太棒了

Langchain 默认使用 OpenAI 的 LLM&#xff08;大语言模型&#xff09;来进行文本推理工作&#xff0c;但主要的问题就是数据的安全性&#xff0c;跟 OpenAI LLM 交互的数据都会上传到 OpenAI 的服务器。 企业内部如果想要使用 LangChain 来构建应用&#xff0c;那最好是让 La…

2024年【裂解(裂化)工艺】考试题库及裂解(裂化)工艺考试总结

题库来源&#xff1a;安全生产模拟考试一点通公众号小程序 裂解&#xff08;裂化&#xff09;工艺考试题库考前必练&#xff01;安全生产模拟考试一点通每个月更新裂解&#xff08;裂化&#xff09;工艺考试总结题目及答案&#xff01;多做几遍&#xff0c;其实通过裂解&#…

第3课 使用FFmpeg获取并播放音频流

本课对应源文件下载链接&#xff1a; https://download.csdn.net/download/XiBuQiuChong/88680079 FFmpeg作为一套庞大的音视频处理开源工具&#xff0c;其源码有太多值得研究的地方。但对于大多数初学者而言&#xff0c;如何快速利用相关的API写出自己想要的东西才是迫切需要…

关于“Python”Django 管理网站的核心知识点整理大全52

目录 注意 18.2.2 激活模型 settings.py 18.2.3 Django 管理网站 1. 创建超级用户 注意 2. 向管理网站注册模型 admin.py 注意 3. 添加主题 Climbing。 18.2.4 定义模型 Entry models.py 18.2.5 迁移模型 Entry 18.2.6 向管理网站注册 Entry admin.py 往期快速…

C++:stack、queue、priority_queue增删查改模拟实现、deque底层原理

C:stack、queue、priority_queue增删查改模拟实现 前言一、Cstack的介绍和使用1.1 引言1.2 satck模拟实现 二、Cqueue的介绍和使用2.1 引言2.2 queue增删查改模拟实现 三、STL标准库中stack和queue的底层结构:deque3.1 deque的简单介绍(了解)3.2 deque的缺陷3.3 为什么选择dequ…

c++哈希表——超实用的数据结构

文章目录 1. 概念引入1.1 整数哈希1.1.1 直接取余法。1.1.2 哈希冲突1.1.2.1 开放寻址法1.1.2.2 拉链法 1.2 字符串哈希 3.结语 1. 概念引入 哈希表是一种高效的数据结构 。 H a s h Hash Hash表又称为散列表&#xff0c;一般由 H a s h Hash Hash函数(散列函数)与链表结构共同…

【代码随想录】刷题笔记Day42

前言 这两天机器狗终于搞定了&#xff0c;一个控制ROS大佬&#xff0c;一个计院编程大佬&#xff0c;竟然真把创新点这个弄出来了&#xff0c;牛牛牛牛&#xff08;菜鸡我只能负责在旁边喊加油&#xff09;。下午翘了自辩课来刷题&#xff0c;这次应该是元旦前最后一刷了&…

车载电子电器架构 —— 电子电气系统开发角色定义

车载电子电器架构 —— 电子电气系统开发角色定义 我是穿拖鞋的汉子,魔都中坚持长期主义的汽车电子工程师。 注:本文12000字,深度思考者进!!! 老规矩,分享一段喜欢的文字,避免自己成为高知识低文化的工程师: 屏蔽力是信息过载时代一个人的特殊竞争力,任何消耗你的…
最新文章