NVIDIA-cuSPARSE数据类型2023年(二)

请添加图片描述

4 cuSPARSE数据类型参考

4.1 数据类型

  • float,double,cuComplex,cuDoubleComplex后两个类型是来自cuComplex.h

4.2 cusparseStatus_t

表示库函数返回的状态,可以有以下取值:

  • CUSPARSE_STATUS_SUCCESS 操作成功完成
  • CUSPARSE_STATUS_NOT_INITIALIZED 库没有初始化,通常是因为缺少预先调用,或者是硬件配置错误
  • CUSPARSE_STATUS_ALLOC_FAILEDcuSPARSE内存分配失败,通常是由设备内存分配(cudaMalloc)或者主机内存分配失败造成的,可以在函数调用前尽可能地释放之前分配的内存
  • CUSPARSE_STATUS_INVALID_VALUE传入的参数值有误
  • CUSPARSE_STATUS_ARCH_MISMATCH设备问题,需要在具有适当计算运行能力的设备上编译并运行应用程序
  • CUSPARSE_STATUS_EXECUTION_FAILEDGPU程序执行失败。处理步骤这通常是由GPU内核启动失败引起的,这可能是由多种原因引起的:检查硬件、适当版本的驱动程序和cuSPARSE库是否正确安装
  • CUSPARSE_STATUS_INTERNAL_ERROR检查硬件、适当版本的驱动程序和cuSPARSE库是否正确安装。另外,检查作为参数传递给例程的内存是否在例程完成之前被释放
  • CUSPARSE_STATUS_MATRIX_TYPE_NOT_SUPPORTED此函数不支持矩阵类型。这通常是由于向函数传递无效的矩阵描述符引起的
    纠正方法:检查cusparseMatDescr_t descrA中的字段是否设置正确
  • CUSPARSE_STATUS_NOT_SUPPORTED该函数目前不支持操作或数据类型组合
  • CUSPARSE_STATUS_INSUFFICIENT_RESOURCES 用于计算的资源(如GPU全局内存或共享内存)不足以完成该操作。该错误也可以表明当前的计算模式(例如稀疏矩阵索引的比特大小)不允许处理给定的输入

4.3 cusparseHandle_t

这是一个指针类型,用户必须在调用cusparseCreate()任何其他库函数之前初始化该上下文。由cusparseCreate()创建和返回的句柄必须传递给每个cuSPARSE函数。

4.4. cusparsePointerMode_t

表示向量是否在主机或者GPU上通过引用传递。如果在函数调用中通过引用传递几个标量值,那么它们将遵循相同的单指针模式。指针模式可以分别使用cusparseSetPointerMode()cusparseGetPointerMode()例程设置和检索。

  • CUSPARSE_POINTER_MODE_HOST标量在主机上通过引用传递
  • CUSPARSE_POINTER_MODE_DEVICE标量在设备上通过引用传递

4.5. cusparseOperation_t

此类型指示操作是仅对索引执行,还是对数据和索引执行。

  • CUSPARSE_ACTION_SYMBOLIC操作只对索引进行
  • CUSPARSE_ACTION_NUMERIC操作对数值和索引都执行

4.7. cusparseDirection_t

该类型表示函数cusparse[S|D|C|Z]nnz中密集矩阵的元素应该按行还是按列(假设密集矩阵的内存中有列为主存储)进行解析。此外,BSR格式的块的存储格式也由该类型控制。

  • CUSPARSE_DIRECTION_ROW矩阵应该按行解析
  • CUSPARSE_DIRECTION_COLUMN矩阵应该按列解析

4.8. cusparseMatDescr_t

这个结构用来描述矩阵的形状和性质

typedef struct {
    cusparseMatrixType_t MatrixType;
    cusparseFillMode_t FillMode;
    cusparseDiagType_t DiagType;
    cusparseIndexBase_t IndexBase;
} cusparseMatDescr_t;

4.8.1cusparseDiagType_t

请添加图片描述

  • CUSPARSE_DIAG_TYPE_NON_UNIT矩阵对角线有非单位元素
  • CUSPARSE_DIAG_TYPE_UNIT句怎对角线有单位元素

4.8.2. cusparseFillMode_t

该类型表示矩阵的下部或上部存储在稀疏存储中

  • CUSPARSE_FILL_MODE_LOWER下三角部分被存储
  • CUSPARSE_FILL_MODE_UPPER上三角部分被存储

4.8.3. cusparseIndexBase_t

表示矩阵是从0开始索引还是从1开始索引

  • CUSPARSE_INDEX_BASE_ZERO从0开始索引
  • CUSPARSE_INDEX_BASE_ONE从1开始索引

4.8.4. cusparseMatrixType_t

请添加图片描述

4.9cusparseColorInfo_t

这是指向不透明结构的指针类型,该结构包含csrcolor()中使用的信息。

4.10cusparseSolvePolicy_t

该类型表示是否在bsric02_bufferSize(), bsric02_analysis(), and bsric02()中生成和使用级别信息

  • CUSPARSE_SOLVE_POLICY_NO_LEVEL不生成和使用级别信息
  • CUSPARSE_SOLVE_POLICY_USE_LEVEL
    生成并使用级别信息

请添加图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/7992.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

SpringBoot整合junitmybatis

SpringBoot整合junit&mybatis3,SpringBoot整合junit3.1 环境准备3.2 编写测试类4,SpringBoot整合mybatis4.1 回顾Spring整合Mybatis4.2 SpringBoot整合mybatis4.2.1 创建模块4.2.2 定义实体类4.2.3 定义dao接口4.2.4 定义测试类4.2.5 编写配置4.2.6 …

拉取代码到本地 git pull 和 git clone 的区别

一、git pull 使用 git pull 拉取代码,你需有权限。 从你自己的远程仓库拉取代码,或者使用你团队的仓库拉取代码。 1.有 有权限可以拉取代码的远程仓库 1. 所以首先要连接远程仓库,前提你得先有个本地仓库存放,如果没有先创建。 …

ToBeWritten之反入侵安全技术面经总结

也许每个人出生的时候都以为这世界都是为他一个人而存在的,当他发现自己错的时候,他便开始长大 少走了弯路,也就错过了风景,无论如何,感谢经历 转移发布平台通知:将不再在CSDN博客发布新文章,敬…

ReactJS到React-Native,架构原理概述

React是一个纯JS的UI库,只能干HTML/CSS/JS 提供的Web服务(新的H5 API不一定支持), React-Native厉害在于它能打通JS和Native Code, 让JS能够调用丰富的原生接口,充分发挥硬件的能力, 实现非常复杂的效果,同时能保证效率和跨平台性…

【CocosCreator入门】CocosCreator组件 | MotionStreak(拖尾)组件

Cocos Creator 是一款流行的游戏开发引擎,具有丰富的组件和工具,其中MotionStreak是Cocos Creator中一个非常有用的特效组件,可以创建出类似于拖尾的效果。本文将深入讲解MotionStreak的实现原理及使用方法。 目录 一、MotionStreak的实现原…

黑客与渗透师的区别,如何才能成为一名黑客

网络安全员顾名思义就是“研究网络的安全性的人员”没有“渗透师”这个称呼,都是“渗透测试工程师”“黑客”像是个俗名,广义概念上是一种精神,狭义概念还得按照时代来分1、网络安全这个领域非常庞大,包括了安全服务(渗…

碉堡!“万物皆可分”标记模型上线「GitHub 热点速览」

作者:HelloGitHub-小鱼干这周有个让人眼前一亮的图像识别模型 segment-anything,它能精细地框出所有可见物体,它标记出的物体边界线清晰可见。如此出色的模型,自然获得了不少人的赞赏,开源没几天,就拿下了 …

VSCode+PyQt之Python界面编写

环境配置 1、python3.9 2、安装库 pip install PyQt5 pip install PyQt5-tools3、选择python解释器 4、在VSCode里下载并安装PYQT Integration 5、配置pyqt integration 5.1 将下面改为:D:\ProgramFiles\Python39\Scripts\pyuic5.exe 5.2 将下面的改为&#xff…

Kafka 入门篇(三)

文章目录 提交和偏移量的概念特殊偏移自动提交提交当前偏移量异步提交同步和异步组合提交提交特定的偏移量提交和偏移量的概念 特殊偏移 我们上面提到,消费者在每次调用poll() 方法进行定时轮询的时候,会返回由生产者写入 Kafka 但是还没有被消费者消费的记录,因此我们可以…

ccc-pytorch-宝可梦自定义数据集实战-加载数据部分(9)

文章目录第一步:构建路径与种类的映射关系第二步:载入所有的宝可梦图像第三步:打散顺序并通过路径名提取映射关系构建映射文件第四步:完善选取、获取图片信息功能并可视化第五步:对数据进行预处理第六步:批…

【李宏毅】深度学习——HW4-Speaker Identification

Speaker Identification 1.Goal 根据给定的语音内容,识别出说话者是谁 2.Data formats 2.1data directory 目录下有三个json文件和很多pt文件,三个json文件作用标注在下图中,pt文件就是语音内容。 mapping文件 metadata文件 n_mels:Th…

飞桨EasyDL落地三大工业场景,工业AI赋能产业升级

数智化时代,如何利用人工智能实现传统生产方式的转型升级,成为摆在每个工业制造企业的一道必答题。工业生产、质检、管理等环节,持续产生海量数据。以机器视觉为代表的AI技术,广泛应用在3C电子、快消品制造、汽车零部件制造等多个…

指令系统和寻址方式

文章目录指令系统指令的基本格式扩展码指令格式指令的操作类型指令的寻址方式指令寻址数据寻址隐含寻址立即寻址直接寻址间接寻址寄存器寻址寄存器间接寻址相对寻址基址寻址变址寻址堆栈寻址使用场景PSW小结程序的机器级代码表示CISC和RISC刷题小结指令系统 指令:计…

Revit插件 | 建模助手2023年度版本大更新,就是这么懂你

​大家好,本期是懂你的建模助手。 从去年开始,建模助手几乎每个月都会有大大小小的活动,目的是让大家用最低的成本尝试极棒的建模体验!强行挽尊ing 但作为一支很pro的团队,单一地搞活动肯定不行滴,还得在…

Python SMTP发送邮件和线程

文章目录一、Python SMTP发送邮件二、Python3 多线程总结一、Python SMTP发送邮件 SMTP(Simple Mail Transfer Protocol)即简单邮件传输协议,它是一组用于由源地址到目的地址传送邮件的规则,由它来控制信件的中转方式。 python的smtplib提供…

使用ChatGPT帮助我们编码的10种场景

文章目录1、技术搜索2、生成常用工具函数3、帮助解读代码4、添加注释5、优化代码6、Vue2 转 Vue37、Vue 转 React8、补充 TypeScript 类型9、生成文档10、工具配置总结ChatGPT 的出现,彻底改变的很多代码开发的方式,特别是通用型的代码,使用它…

基于公私密钥的单点登录

目前已知的单点登陆方式有: 多个系统集群 建立一个SSO认证中心,用户只需要登录一次就可以访问所有相互信任的应用系统。 1、可以通过session广播机制实现:在一个集群中的一个模块登录后,然后把这个session复制n份,发…

JUC-01 线程的创建和状态转换

本次我们主要讲三个问题 线程是什么?线程有哪些状态?各状态间的转换了解吗?创建线程的3种方法你都了解吗? 1. 线程是什么?(了解即可) 进程: 进程是一个具有一定独立功能的程序在一…

计算机网络考试复习——第一章 1.7

1.7 计算机网络体系结构 两台计算机要互相传送文件需解决很多问题: (1) 必须有一条传送数据的通路。 (2) 发起方必须激活通路。 (3) 要告诉网络如何识别接收方。 (4) 发起方要清楚对方是否已开机,且与网络连接正常。 (5) 发起方要清楚对方是否准备好接收和存储文件…