【YOLOv8/YOLOv7/YOLOv5/YOLOv4/Faster-rcnn系列算法改进NO.59】引入ASPP模块

前言
作为当前先进的深度学习目标检测算法YOLOv8,已经集合了大量的trick,但是还是有提高和改进的空间,针对具体应用场景下的检测难点,可以不同的改进方法。此后的系列文章,将重点对YOLOv8的如何改进进行详细的介绍,目的是为了给那些搞科研的同学需要创新点或者搞工程项目的朋友需要达到更好的效果提供自己的微薄帮助和参考。由于出到YOLOv8,YOLOv7、YOLOv5算法2020年至今已经涌现出大量改进论文,这个不论对于搞科研的同学或者已经工作的朋友来说,研究的价值和新颖度都不太够了,为与时俱进,以后改进算法以YOLOv7为基础,此前YOLOv5改进方法在YOLOv7同样适用,所以继续YOLOv5系列改进的序号。另外改进方法在YOLOv5等其他算法同样可以适用进行改进。希望能够对大家有帮助。
链接: https://pan.baidu.com/s/1e83xPdxwmSJ0Nohc_F9nFA
提取码:关注私信后获取

一、解决问题

尝试将原YOLOv5中的sppf改为ASPP,提升精度和效果。

二、基本原理

说明:图片来自DeepLabV3 Rethinking Atrous Convolution for Semantic Image Segmentation

三、​添加方法

(1)YOLOv5网络模型更改

添加后的网络模型结构图如下(YOLOv5s基础上添加):

(2)YOLOv7网络模型更改

添加后的网络模型结构图如下(YOLOv7基础上添加,将其中的

改为 [[-1, 1, ASPP, [1024]], # 最终形成结构图如下所示:

# parameters
nc: 1  # number of classes
depth_multiple: 1.0  # model depth multiple
width_multiple: 1.0  # layer channel multiple

# anchors
anchors:
  - [12,16, 19,36, 40,28]  # P3/8
  - [36,75, 76,55, 72,146]  # P4/16
  - [142,110, 192,243, 459,401]  # P5/32

# yolov7 backbone
backbone:
  # [from, number, module, args]
  [[-1, 1, Conv, [32, 3, 1]],  # 0
  
   [-1, 1, Conv, [64, 3, 2]],  # 1-P1/2      
   [-1, 1, Conv, [64, 3, 1]],
   
   [-1, 1, Conv, [128, 3, 2]],  # 3-P2/4  
   [-1, 1, Conv, [64, 1, 1]],
   [-2, 1, Conv, [64, 1, 1]],
   [-1, 1, Conv, [64, 3, 1]],
   [-1, 1, Conv, [64, 3, 1]],
   [-1, 1, Conv, [64, 3, 1]],
   [-1, 1, Conv, [64, 3, 1]],
   [[-1, -3, -5, -6], 1, Concat, [1]],
   [-1, 1, Conv, [256, 1, 1]],  # 11
         
   [-1, 1, MP, []],
   [-1, 1, Conv, [128, 1, 1]],
   [-3, 1, Conv, [128, 1, 1]],
   [-1, 1, Conv, [128, 3, 2]],
   [[-1, -3], 1, Concat, [1]],  # 16-P3/8  
   [-1, 1, Conv, [128, 1, 1]],
   [-2, 1, Conv, [128, 1, 1]],
   [-1, 1, Conv, [128, 3, 1]],
   [-1, 1, Conv, [128, 3, 1]],
   [-1, 1, Conv, [128, 3, 1]],
   [-1, 1, Conv, [128, 3, 1]],
   [[-1, -3, -5, -6], 1, Concat, [1]],
   [-1, 1, Conv, [512, 1, 1]],  # 24
         
   [-1, 1, MP, []],
   [-1, 1, Conv, [256, 1, 1]],
   [-3, 1, Conv, [256, 1, 1]],
   [-1, 1, Conv, [256, 3, 2]],
   [[-1, -3], 1, Concat, [1]],  # 29-P4/16  
   [-1, 1, Conv, [256, 1, 1]],
   [-2, 1, Conv, [256, 1, 1]],
   [-1, 1, Conv, [256, 3, 1]],
   [-1, 1, Conv, [256, 3, 1]],
   [-1, 1, Conv, [256, 3, 1]],
   [-1, 1, Conv, [256, 3, 1]],
   [[-1, -3, -5, -6], 1, Concat, [1]],
   [-1, 1, Conv, [1024, 1, 1]],  # 37
         
   [-1, 1, MP, []],
   [-1, 1, Conv, [512, 1, 1]],
   [-3, 1, Conv, [512, 1, 1]],
   [-1, 1, Conv, [512, 3, 2]],
   [[-1, -3], 1, Concat, [1]],  # 42-P5/32  
   [-1, 1, Conv, [256, 1, 1]],
   [-2, 1, Conv, [256, 1, 1]],
   [-1, 1, Conv, [256, 3, 1]],
   [-1, 1, Conv, [256, 3, 1]],
   [-1, 1, Conv, [256, 3, 1]],
   [-1, 1, Conv, [256, 3, 1]],
   [[-1, -3, -5, -6], 1, Concat, [1]],
   [-1, 1, Conv, [1024, 1, 1]],  # 50
  ]

# yolov7 head
head:
  [[-1, 1, ASPP, [1024]], # 51
  
   [-1, 1, Conv, [256, 1, 1]],
   [-1, 1, nn.Upsample, [None, 2, 'nearest']],
   [37, 1, Conv, [256, 1, 1]], # route backbone P4
   [[-1, -2], 1, Concat, [1]],
   
   [-1, 1, Conv, [256, 1, 1]],
   [-2, 1, Conv, [256, 1, 1]],
   [-1, 1, Conv, [128, 3, 1]],
   [-1, 1, Conv, [128, 3, 1]],
   [-1, 1, Conv, [128, 3, 1]],
   [-1, 1, Conv, [128, 3, 1]],
   [[-1, -2, -3, -4, -5, -6], 1, Concat, [1]],
   [-1, 1, Conv, [256, 1, 1]], # 63
   
   [-1, 1, Conv, [128, 1, 1]],
   [-1, 1, nn.Upsample, [None, 2, 'nearest']],
   [24, 1, Conv, [128, 1, 1]], # route backbone P3
   [[-1, -2], 1, Concat, [1]],
   
   [-1, 1, Conv, [128, 1, 1]],
   [-2, 1, Conv, [128, 1, 1]],
   [-1, 1, Conv, [64, 3, 1]],
   [-1, 1, Conv, [64, 3, 1]],
   [-1, 1, Conv, [64, 3, 1]],
   [-1, 1, Conv, [64, 3, 1]],
   [[-1, -2, -3, -4, -5, -6], 1, Concat, [1]],
   [-1, 1, Conv, [128, 1, 1]], # 75
      
   [-1, 1, MP, []],
   [-1, 1, Conv, [128, 1, 1]],
   [-3, 1, Conv, [128, 1, 1]],
   [-1, 1, Conv, [128, 3, 2]],
   [[-1, -3, 63], 1, Concat, [1]],
   
   [-1, 1, Conv, [256, 1, 1]],
   [-2, 1, Conv, [256, 1, 1]],
   [-1, 1, Conv, [128, 3, 1]],
   [-1, 1, Conv, [128, 3, 1]],
   [-1, 1, Conv, [128, 3, 1]],
   [-1, 1, Conv, [128, 3, 1]],
   [[-1, -2, -3, -4, -5, -6], 1, Concat, [1]],
   [-1, 1, Conv, [256, 1, 1]], # 88
      
   [-1, 1, MP, []],
   [-1, 1, Conv, [256, 1, 1]],
   [-3, 1, Conv, [256, 1, 1]],
   [-1, 1, Conv, [256, 3, 2]],
   [[-1, -3, 51], 1, Concat, [1]],
   
   [-1, 1, Conv, [512, 1, 1]],
   [-2, 1, Conv, [512, 1, 1]],
   [-1, 1, Conv, [256, 3, 1]],
   [-1, 1, Conv, [256, 3, 1]],
   [-1, 1, Conv, [256, 3, 1]],
   [-1, 1, Conv, [256, 3, 1]],
   [[-1, -2, -3, -4, -5, -6], 1, Concat, [1]],
   [-1, 1, Conv, [512, 1, 1]], # 101
   
   [75, 1, RepConv, [256, 3, 1]],
   [88, 1, RepConv, [512, 3, 1]],
   [101, 1, RepConv, [1024, 3, 1]],

   [[102,103,104], 1, Detect, [nc, anchors]],   # Detect(P3, P4, P5)
  ]

四、总结

预告一下:下一篇内容将继续分享深度学习算法相关改进方法。有兴趣的朋友可以关注一下我,有问题可以留言或者私聊我哦

PS:该方法不仅仅是适用改进YOLOv5,也可以改进其他的YOLO网络以及目标检测网络,比如YOLOv7、v6、v4、v3,Faster rcnn ,ssd等。

最后,有需要的请关注私信我吧。关注免费领取深度学习算法学习资料!

YOLO系列算法改进方法 | 目录一览表

[💡🎈☁️1. 添加SE注意力机制](https://blog.csdn.net/m0_70388905/article/details/125379649)

[💡🎈☁️2.添加CBAM注意力机制](https://blog.csdn.net/m0_70388905/article/details/125892144)

[💡🎈☁️3. 添加CoordAtt注意力机制](https://blog.csdn.net/m0_70388905/article/details/125379685)

[💡🎈☁️4. 添加ECA通道注意力机制](https://blog.csdn.net/m0_70388905/article/details/125390766)

[💡🎈☁️5. 改进特征融合网络PANET为BIFPN](https://blog.csdn.net/m0_70388905/article/details/125391096)

[💡🎈☁️6. 增加小目标检测层](https://blog.csdn.net/m0_70388905/article/details/125392908)

[💡🎈☁️7. 损失函数改进](https://blog.csdn.net/m0_70388905/article/details/125419887)

[💡🎈☁️8. 非极大值抑制NMS算法改进Soft-nms](https://blog.csdn.net/m0_70388905/article/details/125448230)

[💡🎈☁️9. 锚框K-Means算法改进K-Means++](https://blog.csdn.net/m0_70388905/article/details/125530323)

[💡🎈☁️10. 损失函数改进为SIOU](https://blog.csdn.net/m0_70388905/article/details/125569509)

[💡🎈☁️11. 主干网络C3替换为轻量化网络MobileNetV3](https://blog.csdn.net/m0_70388905/article/details/125593267)

[💡🎈☁️12. 主干网络C3替换为轻量化网络ShuffleNetV2](https://blog.csdn.net/m0_70388905/article/details/125612052)

[💡🎈☁️13. 主干网络C3替换为轻量化网络EfficientNetv2](https://blog.csdn.net/m0_70388905/article/details/125612096)

[💡🎈☁️14. 主干网络C3替换为轻量化网络Ghostnet](https://blog.csdn.net/m0_70388905/article/details/125612392)

[💡🎈☁️15. 网络轻量化方法深度可分离卷积](https://blog.csdn.net/m0_70388905/article/details/125612300)

[💡🎈☁️16. 主干网络C3替换为轻量化网络PP-LCNet](https://blog.csdn.net/m0_70388905/article/details/125651427)

[💡🎈☁️17. CNN+Transformer——融合Bottleneck Transformers](https://blog.csdn.net/m0_70388905/article/details/125691455)

[💡🎈☁️18. 损失函数改进为Alpha-IoU损失函数](https://blog.csdn.net/m0_70388905/article/details/125704413)

[💡🎈☁️19. 非极大值抑制NMS算法改进DIoU NMS](https://blog.csdn.net/m0_70388905/article/details/125754133)

[💡🎈☁️20. Involution新神经网络算子引入网络](https://blog.csdn.net/m0_70388905/article/details/125816412)

[💡🎈☁️21. CNN+Transformer——主干网络替换为又快又强的轻量化主干EfficientFormer](https://blog.csdn.net/m0_70388905/article/details/125840816)

[💡🎈☁️22. 涨点神器——引入递归门控卷积(gnConv)](https://blog.csdn.net/m0_70388905/article/details/126142505)

[💡🎈☁️23. 引入SimAM无参数注意力](https://blog.csdn.net/m0_70388905/article/details/126456722)

[💡🎈☁️24. 引入量子启发的新型视觉主干模型WaveMLP(可尝试发SCI)](https://blog.csdn.net/m0_70388905/article/details/126550613)

[💡🎈☁️25. 引入Swin Transformer](https://blog.csdn.net/m0_70388905/article/details/126674046)

[💡🎈☁️26. 改进特征融合网络PANet为ASFF自适应特征融合网络](https://blog.csdn.net/m0_70388905/article/details/126926244)

[💡🎈☁️27. 解决小目标问题——校正卷积取代特征提取网络中的常规卷积](https://blog.csdn.net/m0_70388905/article/details/126979207)

[💡🎈☁️28. ICLR 2022涨点神器——即插即用的动态卷积ODConv](https://blog.csdn.net/m0_70388905/article/details/127031843)

[💡🎈☁️29. 引入Swin Transformer v2.0版本](https://blog.csdn.net/m0_70388905/article/details/127214397)

[💡🎈☁️30. 引入10月4号发表最新的Transformer视觉模型MOAT结构](https://blog.csdn.net/m0_70388905/article/details/127273808)

[💡🎈☁️31. CrissCrossAttention注意力机制](https://blog.csdn.net/m0_70388905/article/details/127312771)

[💡🎈☁️32. 引入SKAttention注意力机制](https://blog.csdn.net/m0_70388905/article/details/127330663)

[💡🎈☁️33. 引入GAMAttention注意力机制](https://blog.csdn.net/m0_70388905/article/details/127330819)

[💡🎈☁️34. 更换激活函数为FReLU](https://blog.csdn.net/m0_70388905/article/details/127381053)

[💡🎈☁️35. 引入S2-MLPv2注意力机制](https://blog.csdn.net/m0_70388905/article/details/127434190)

[💡🎈☁️36. 融入NAM注意力机制](https://blog.csdn.net/m0_70388905/article/details/127398898)

[💡🎈☁️37. 结合CVPR2022新作ConvNeXt网络](https://blog.csdn.net/m0_70388905/article/details/127533379)

[💡🎈☁️38. 引入RepVGG模型结构](https://blog.csdn.net/m0_70388905/article/details/127532645)

[💡🎈☁️39. 引入改进遮挡检测的Tri-Layer插件 | BMVC 2022](https://blog.csdn.net/m0_70388905/article/details/127471913)

[💡🎈☁️40. 轻量化mobileone主干网络引入](https://blog.csdn.net/m0_70388905/article/details/127558329)

[💡🎈☁️41. 引入SPD-Conv处理低分辨率图像和小对象问题](https://zhuanlan.zhihu.com/p/579212232)

[💡🎈☁️42. 引入V7中的ELAN网络](https://zhuanlan.zhihu.com/p/579533276)

[💡🎈☁️43. 结合最新Non-local Networks and Attention结构](https://zhuanlan.zhihu.com/p/579903718)

[💡🎈☁️44. 融入适配GPU的轻量级 G-GhostNet](https://blog.csdn.net/m0_70388905/article/details/127932181)

[💡🎈☁️45. 首发最新特征融合技术RepGFPN(DAMO-YOLO)](https://blog.csdn.net/m0_70388905/article/details/128157269)

[💡🎈☁️46. 改进激活函数为ACON](https://blog.csdn.net/m0_70388905/article/details/128159516)

[💡🎈☁️47. 改进激活函数为GELU](https://blog.csdn.net/m0_70388905/article/details/128170907)

[💡🎈☁️48. 构建新的轻量网络—Slim-neck by GSConv(2022CVPR)](https://blog.csdn.net/m0_70388905/article/details/128198484)

[💡🎈☁️49. 模型剪枝、蒸馏、压缩](https://blog.csdn.net/m0_70388905/article/details/128222629)

[💡🎈☁️50. 超越ConvNeXt!Conv2Former:用于视觉识别的Transformer风格的ConvNet](https://blog.csdn.net/m0_70388905/article/details/128266070?csdn_share_tail=%7B%22type%22:%22blog%22,%22rType%22:%22article%22,%22rId%22:%22128266070%22,%22source%22:%22m0_70388905%22%7D)

[💡🎈☁️51.融入多分支空洞卷积结构RFB-Bottleneck改进PANet构成新特征融合网络](https://blog.csdn.net/m0_70388905/article/details/128553832)

[💡🎈☁️52.将YOLOv8中的C2f模块融入YOLOv5](https://blog.csdn.net/m0_70388905/article/details/128661165)

[💡🎈☁️53.融入CFPNet网络中的ECVBlock模块,提升小目标检测能力](https://blog.csdn.net/m0_70388905/article/details/128720459)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/62.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

1.10-1.12 Makefile

1. Makefile简介 举个栗子,如下为redis-5.0.10的项目目录,有很多的文件 有了Makefile文件,可以简单的make一下就可以对项目文件进行编译,最终生成可执行程序。 2. Makefile栗子1 首先,创建vim Makefile按照PPT里的格…

C++STL set/multiset容器 构造和赋值 大小和交换 插入和删除 查找和统计

文章目录set/multiset容器1 set容器 基本概念2 set容器 构造和赋值3 set容器 大小和交换4 set容器 插入和删除5 set容器 查找和统计set/multiset容器 1 set容器 基本概念 简介: 所有元素都会在插入时会被自动排序,例如,在set容器放入元素1、…

成本降低90%,OpenAI正式开放ChαtGΡΤ

今天凌晨,OpenAI官方发布ChαtGΡΤ和Whisper的接囗,开发人员现在可以通过API使用最新的文本生成和语音转文本功能。OpenAI称:通过一系列系统级优化,自去年12月以来,ChαtGΡΤ的成本降低了90%;现在OpenAI用…

公网远程连接Oracle数据库【内网穿透】

文章目录1. 数据库搭建2. 内网穿透2.1 安装cpolar内网穿透2.2 创建隧道映射3. 公网远程访问4. 配置固定TCP端口地址4.1 保留一个固定的公网TCP端口地址4.2 配置固定公网TCP端口地址4.3 测试使用固定TCP端口地址远程OracleOracle,是甲骨文公司的一款关系数据库管理系…

【前端vue2面试题】2023前端最新版vue2模块,高频24问

​ 🥳博 主:初映CY的前说(前端领域) 🌞个人信条:想要变成得到,中间还有做到! 🤘本文核心:博主收集的关于vue2面试题 目录 vue2面试题 1、$route 和 $router的区别 2、一个.v…

2月更新 | Visual Studio Code Python

我们很高兴地宣布,2023年2月版 Visual Studio Code Python 和 Jupyter 扩展现已推出!此版本包括以下改进:从激活的终端启动 VS Code 时的自动选择环境 使用命令 Python: Create Environmen 时可选择需求文件或可选依赖项 预发布:改…

java八股文--java基础

java基础1.什么是面向对象,谈谈对面向对象的理解2.JDK JRE JVM的区别与联系3.和equals4.hashCode与equals5.String StringBuffer StringBuilder的区别6.重载和重写的区别7.接口和抽象类8.List和Set的区别9.ArrayList和LinkedList10.HashMap和HashTable的区别&#x…

2023.03.12学习总结

项目部分写了内外菜单栏的伸缩,更新了导航栏,新增配置,scss变量 提交记录 学习了scss的使用和配置 ,设置了scss全局变量,组件样式 给element-plus配置了主题颜色,配置到了全局 http://t.csdn.cn/FhZYa …

【PyTorch】Pytorch基础第0章

本文参加新星计划人工智能(Pytorch)赛道:https://bbs.csdn.net/topics/613989052 这是目录PyTorch的简介PyTorch 构建深度学习模型的步骤搭建pytorch使用环境PyTorch的简介 PyTorch 是一个开源的机器学习框架,由 Facebook 的人工智能研究院(…

面部表情识别2:Pytorch实现表情识别(含表情识别数据集和训练代码)

面部表情识别2:Pytorch实现表情识别(含表情识别数据集和训练代码) 目录 面部表情识别2:Pytorch实现表情识别(含表情识别数据集和训练代码) 1.面部表情识别方法 2.面部表情识别数据集 (1)表情识别数据集说明 (2&…

蔬菜视觉分拣机器人的设计与实现(RoboWork参赛方案)

蔬菜视觉分拣机器人的设计与实现 文章目录蔬菜视觉分拣机器人的设计与实现1. 技术栈背景2. 整体设计3. 机械结构3.1 整体结构3.2 底座结构3.3 小臂结构3.4 大臂结构3.5 负载组件结构3.6 末端执行器结构4. 硬件部分4.1 视觉系统4.1.1 光源4.1.2 海康工业相机4.2 传送带系统4.2.1…

网络工程师必备知识点

作为网络工程师,您将负责设计、部署和维护计算机网络系统。这包括构建、配置和管理网络设备,如交换机、路由器、防火墙等,并确保网络系统能够高效地运行。您需要了解计算机网络的各个层次、协议、标准和技术,包括TCP/IP、DNS、HTT…

现在的00后,实在是太卷了

现在的小年轻真的卷得过分了。前段时间我们公司来了个00年的,工作没两年,跳槽到我们公司起薪18K,都快接近我了。后来才知道人家是个卷王,从早干到晚就差搬张床到工位睡觉了。 最近和他聊了一次天,原来这位小老弟家里条…

CPU平均负载高问题定位分析

一、Linux操作系统CPU平均负载 1.1什么是CPU平均负载 1.2 怎么查看平均负载数值 二、Linux操作系统CPU使用率和平均负载区别 CPU使用率和平均负载区别 三、阿里云Linux操作系统CPU压测环境准备 3.1 核心命令应用场景 3.2 模拟生产环境出现的多种问题环境准备 分析工具安…

我,30岁程序员被裁了,千万别干全栈

大家好,这里是程序员晚枫,今天是读者投稿。下面开始我们的正文。👇 关注博主👉程序员晚枫 很久了,今天给大家分享一下我从事程序员后,30岁被裁的经历,希望帮到有需要的人。 1、我被裁了 大家好…

某小公司面试记录

记录一次面试过程,还有一些笔试题,挺简单的,排序,去重,this指向,深浅拷贝,微任务的执行顺序,变量提升等。 ES6数组新增的方法 Array.from: 将两类对象转为真正的数组&am…

2月编程语言排行榜新鲜出炉,谁又摘得桂冠?

近日,TIOBE公布了2023年2月编程语言排行榜,本月各个语言表现如何?谁又摘得桂冠?一起来看看吧! TIOBE 2月Top15编程语言: 详细榜单查看TIOBE官网 https://www.tiobe.com/tiobe-index/ 关注IT行业的小伙伴…

【Linux】冯.诺依曼体系结构与操作系统

环境:centos7.6,腾讯云服务器Linux文章都放在了专栏:【Linux】欢迎支持订阅🌹冯.诺依曼体系结构什么是冯诺依曼体系结构?我们如今的计算机比如笔记本,或者是服务器,基本上都遵循冯诺依曼体系结构…

基于HTML实现浪漫情人节表白代码(附源代码)

🤵‍♂️ 个人主页:艾派森的个人主页 ✍🏻作者简介:Python学习者 🐋 希望大家多多支持,我们一起进步!😄 如果文章对你有帮助的话, 欢迎评论 💬点赞&#x1f4…

Java每日一练(20230312)

目录 1. 两数之和 II ★ 2. 反转链表 ★★ 3. 二叉树的层序遍历 II ★★★ 🌟 每日一练刷题专栏 C/C 每日一练 ​专栏 Python 每日一练 专栏 Java 每日一练 专栏 1. 两数之和 II 给定一个已按照 非递减顺序排列 的整数数组 numbers ,请你从数…
最新文章