5.1.tensorRT基础(2)-正确导出onnx的介绍，使得onnx问题尽量少

5.1.tensorRT基础(2)-正确导出onnx的介绍，使得onnx问题尽量少

article2024/5/12 18:10:11/文章来源:https://blog.csdn.net/qq_40672115/article/details/131883840

目录

- 前言
- 1. 正确导出ONNX
- 总结

前言

杜老师推出的 tensorRT从零起步高性能部署课程，之前有看过一遍，但是没有做笔记，很多东西也忘了。这次重新撸一遍，顺便记记笔记。

本次课程学习 tensorRT 基础-正确导出 onnx 的介绍，使得 onnx 问题尽量少

课程大纲可看下面的思维导图

在这里插入图片描述

1. 正确导出ONNX

关于如何正确导出 onnx，主要有以下几点说明：(from 杜老师)

1. 对于任何用到 shape、size 返回值的参数时，例如 tensor.view(tensor.size(0), -1) 这类操作，避免直接使用 tensor.size 的返回值，而是加上 int 转换，tensor.view(int(tensor.size(0)), -1)，断开追踪

2. 对于 nn.Unsample 或 nn.functional.interpolate 函数，使用 scale_factor 指定倍率，而不是使用 size 参数指定大小

3. 对于 reshape、view 操作时，-1 的指定请放到 batch 维度。其它维度可以计算出来即可。batch 维度禁止指定为大于 -1 的明确数字

4. torch.onnx.export 指定 dynamic_axes 参数，并且只指定 batch 维度，禁止其它动态

5. 使用 opset_version=11，不要低于11

6. 避免使用 inplace 操作，例如 y[…, 0:2] = y[…, 0:2] * 2 - 0.5

7. 尽量少的出现 5 个维度，例如 ShuffleNet Module，可以考虑合并 wh 避免出现 5 维

8. 尽量把后处理部分在 onnx 模型中实现，降低后处理复杂度（比如说计算 anchor 这类操作放到 onnx，让我们只需要关注简单的 decode 部分）

9. 掌握了这些，就可以保证后面各种情况的顺利了

这样做法的必要性体现在，简化过程的复杂度，去掉 gather、shape 类的节点，很多时候，部分不这么改看似也是可以，但是需求复杂后，依旧存在各类问题。按照说的这么修改，基本总能成。做了这些，就不需要使用 onnx-simplifer 了。

下面测试了 view 操作时加上 int 转换，且 -1 放在 batch 维度导出的 onnx 差别：

在这里插入图片描述

图1-1 直接view

在这里插入图片描述

图1-2 加上int转换且-1在batch维度

值得注意的是，博主在测试时发现加不加上 int 转换似乎都不会生成 Gather、Unsqueeze 节点，不过依稀记得在 yolov5 导出 onnx 的时候 view 等操作加上了 int 转换后确实减少了很多不必要的节点。

总结

本节课程简要说明了导出 onnx 的一些注意事项，尽量使得生成 engine 的时候问题少，不过目前来看，当导出的 onnx 生成 engine 失败时，博主会先考虑先直接 simplifer，如果能解决最好，解决不了才去分析具体导出的 onnx 可能存在的问题。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mfbz.cn/a/42794.html

如若内容造成侵权/违法违规/事实不符，请联系我们进行投诉反馈qq邮箱809451989@qq.com，一经查实，立即删除！

相关文章

飞书ChatGPT机器人 – 打造智能问答助手实现无障碍交流

飞书ChatGPT机器人 – 打造智能问答助手实现无障碍交流

文章目录前言环境列表1.飞书设置2.克隆feishu-chatgpt项目3.配置config.yaml文件4.运行feishu-chatgpt项目5.安装cpolar内网穿透6.固定公网地址7.机器人权限配置8.创建版本9.创建测试企业10. 机器人测试前言在飞书中创建chatGPT机器人并且对话，在下面操作步骤中…

阅读更多...

基于DeepFace模型设计的人脸识别软件

基于DeepFace模型设计的人脸识别软件

完整资料进入【数字空间】查看——baidu搜索"writebug" 人脸识别软件(无外部API) V2.0 基于DeepFace模型设计的人脸识别软件 V1.0 基于PCA模型设计的人脸识别软件 V2.0 更新时间：2018-08-15 在观看了吴恩达老师的“深度学习课程”，了解了深…

阅读更多...

2023/7/23周报

2023/7/23周报

目录摘要论文阅读 1、题目和现存问题 2、问题阐述及相关定义 3、LGDL模型框架 4、实验准备 5、实验过程深度学习 1、GCN简单分类任务 2、文献引用数据分类案例 3、将时序型数据构建为图数据格式总结摘要本周在论文阅读上，对基于图神经网络与深度…

阅读更多...

【蓝牙AVDTP A2DP协议】

【蓝牙AVDTP A2DP协议】

蓝牙AVDTP A2DP 一.AVDTP1.1 AVDTP概念1.2 Source Sink整体框架1.3 AVDTP术语1.3.2 Stream1.3.2 SRC and Sink1.3.3 INT and ACP1.3.4 SEP： 1.4 AVDTP体系1.4.1 体系概括1.4.2 Transport Services 1.5 Signaling Procedures1.5.1 General Requirements1.5.2 Transac…

阅读更多...

关于Arduino IDE库文件存放路径问题总结（双版本）

关于Arduino IDE库文件存放路径问题总结（双版本）

在开发过程中，如果不注意，库文件存放路径很乱，如果在转移系统环境时，容易忘记备份。编译过程中出现多个可用引用包的位置，为了解决这些问题，要明白各文件夹的默认路径在哪，区别在哪，如有了解不对的地方请指正。 IDE安装目录（默认C盘，自定义可以其他盘符下）IDE升级可…

阅读更多...

2023华为OD统一考试（B卷）题库清单（持续收录中）以及考点说明

2023华为OD统一考试（B卷）题库清单（持续收录中）以及考点说明

目录专栏导读2023 B卷 “新加题”（100分值）2023Q2 100分2023Q2 200分2023Q1 100分2023Q1 200分2022Q4 100分2022Q4 200分牛客练习题专栏导读本专栏收录于《华为OD机试（JAVA）真题（A卷B卷）》。刷的越多&…

阅读更多...

PALO ALTO NETWORKS 的新一代防火墙如何保护企业安全

PALO ALTO NETWORKS 的新一代防火墙如何保护企业安全

轻松采用创新技术、阻止网络攻击得逞并专注更重要的工作 IT 的快速发展已改变网络边界的面貌。数据无处不在，用户可随时随地从各类设备访问这些数据。同时，IT 团队正在采用云、分析和自动化来加速新应用的交付以及推动业务发展。这些根本性的转变带来了…

阅读更多...

11 简单的Thymeleaf语法

11 简单的Thymeleaf语法

11.1 spring-boot环境准备重要依赖：  <dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-thymeleaf</artifactId> </dependency> 11.2 转发消息不转义就是如…

阅读更多...

Vue3状态管理库Pinia——核心概念（Store、State、Getter、Action）

Vue3状态管理库Pinia——核心概念（Store、State、Getter、Action）

个人简介 👀个人主页： 前端杂货铺 🙋‍♂️学习方向： 主攻前端方向，正逐渐往全干发展 📃个人状态： 研发工程师，现效力于中国工业软件事业 🚀人生格言： 积跬步…

阅读更多...

iClient3D for CesiumWebGL入门之使用vscode以服务方式运行调试

iClient3D for CesiumWebGL入门之使用vscode以服务方式运行调试

作者：超图研究院技术支持中心-于丁 iClient3D for Cesium&WebGL入门之使用vscode以服务方式运行调试相信大家第一次使用SuperMap iClient3D for Cesium或SuperMap iClient3D for WebGL的时候，都遇到过和我一样的事情： 在文件夹中直接打…

阅读更多...

Android Studio 提示 Failed to initialize editor问题的解决

Android Studio 提示 Failed to initialize editor问题的解决

Android Studio 从2018的版本升级到2021年的版本后，无法预览xml。我查了很久，最后发现是Gradle的版本和工具不匹配，按照开发工具的提示，升级版本即可，我的是从3.2.1升级到了4.2.2

阅读更多...

生产者消费者模型

生产者消费者模型

生产者消费者模型文章目录生产者消费者模型概念原则优点基于BlockingQueue的生产者消费者模型BlockingQueue模拟实现单生产者消费者模型基于计算任务和存储任务的生产者消费者模型概念生产者消费者模式就是通过一个容器来解决生产者和消费者的强耦合问题生产者和消费者彼…

阅读更多...

C++ 单例模式（介绍+实现）

C++ 单例模式（介绍+实现）

文章目录一. 设计模式二. 单例模式三. 饿汉模式四. 懒汉模式结束语一. 设计模式单例模式是一种设计模式设计模式(Design Pattern)是一套被反复使用，多数人知晓的，经过分类的，代码设计经验的总结。为什么要有设计模式就像人类历史发展会…

阅读更多...

python机器学习（三）特征预处理、鸢尾花案例--分类、线性回归、代价函数、梯度下降法、使用numpy、sklearn实现一元线性回归

python机器学习（三）特征预处理、鸢尾花案例--分类、线性回归、代价函数、梯度下降法、使用numpy、sklearn实现一元线性回归

K-近邻算法(K-Nearest Neighboor) 特征预处理数据预处理的过程。数据存在不同的量纲、数据中存在离群值，需要稳定的转换数据，处理好的数据才能更好的去训练模型，减少误差的出现。标准化数据集的标准化对scikit-learn中实现的大多数机器…

阅读更多...

遥感目标检测（3）-DAL（Dynamic Anchor Learning for Object Detection）

遥感目标检测（3）-DAL（Dynamic Anchor Learning for Object Detection）

目录一、概述二、背景三、建议 1、旋转RetinaNet 2、动态锚框分布 3、匹配敏感损失四、实验一、概述由于选择正样本锚框进行回归，不一定能够定位真实的GT，而部分负样本回归甚至可以回归到真实的GT，说明相当多的负样本锚框有着准…

阅读更多...

【自启动配置】Ubuntu 设置开机自启动脚本

【自启动配置】Ubuntu 设置开机自启动脚本

Ubuntu 开机运行的脚本和当前操作系统运行的级别有关，OS 的运行级别大概分为七个目录 1、查看 OS 运行级别 2、创建自启动脚本 3、添加软链接 1、查看 OS 运行级别输入命令 runlevel 查看当前系统运行级别。当前系统的运行级别为 5 2、创建自启动脚本在 /et…

阅读更多...

ZooKeeper原理剖析

ZooKeeper原理剖析

1.ZooKeeper简介 ZooKeeper是一个分布式、高可用性的协调服务。在大数据产品中主要提供两个功能： 帮助系统避免单点故障，建立可靠的应用程序。提供分布式协作服务和维护配置信息。 2.ZooKeeper结构 ZooKeeper集群中的节点分为三种角色：Le…

阅读更多...

多线程（JavaEE初阶系列2）

多线程（JavaEE初阶系列2）

目录前言： 1.什么是线程 2.为什么要有线程 3.进程与线程的区别与联系 4.Java的线程和操作系统线程的关系 5.多线程编程示例 6.创建线程 6.1继承Thread类 6.2实现Runnable接口 6.3继承Thread，使用匿名内部类 6.4实现Runnable接口，使…

阅读更多...

html2Canvas+JsPDF 导出pdf 无法显示网络图片

html2Canvas+JsPDF 导出pdf 无法显示网络图片

html2CanvasJsPDF 导出pdf 问题：类似于下面着这种网络图片使用img导出的时候是空白的 https://gimg3.baidu.com/search/srchttp%3A%2F%2Fpics4.baidu.com%2Ffeed%2F7e3e6709c93d70cf827fb2fda054500cb8a12bc9.jpeg%40f_auto%3Ftoken%3Dd97d3f0fd06e680e592584f8c7a2…

阅读更多...

深度学习——LSTM解决分类问题

深度学习——LSTM解决分类问题

RNN基本介绍概述循环神经网络（Recurrent Neural Network，RNN）是一种深度学习模型，主要用于处理序列数据，如文本、语音、时间序列等具有时序关系的数据。核心思想 RNN的关键思想是引入了循环结构，允许…

阅读更多...

最新文章