CANN/asc-devkit伪量化API文档

📅 2026/7/4 14:37:02 👁️ 阅读次数 📝 编程学习
CANN/asc-devkit伪量化API文档

SetAntiQuantScalar

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

产品支持情况

产品

是否支持

Ascend 950PR/Ascend 950DT

x

Atlas A3 训练系列产品 / Atlas A3 推理系列产品

x

Atlas A2 训练系列产品 / Atlas A2 推理系列产品

x

Kirin X90

x

Kirin 9030

x

功能说明

在Matmul计算时支持A矩阵half类型输入,B矩阵int8类型输入,该场景下,需要调用伪量化接口进行伪量化。调用伪量化接口后,将数据从GM搬出到L1时,会执行伪量化操作,将B矩阵转化为half类型。本节的伪量化接口提供对B矩阵的所有数据采用同一量化系数进行伪量化的功能。

请在Iterate或者IterateAll之前调用该接口。

函数原型

__aicore__ inline void SetAntiQuantScalar(const SrcT offsetScalar, const SrcT scaleScalar)

参数说明

参数名

输入/输出

描述

offsetScalar

输入

伪量化系数,用于加法。SrcT为A_TYPE中对应的数据类型。

scaleScalar

输入

伪量化系数,用于乘法。SrcT为A_TYPE中对应的数据类型。

返回值说明

约束说明

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考