CANN白盒设计网络搜索

📅 2026/7/4 7:08:00 👁️ 阅读次数 📝 编程学习

Task C：网络搜索

【免费下载链接】cannbot-skillsCANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体，本仓库为其提供可复用的 Skills 模块。项目地址: https://gitcode.com/cann/cannbot-skills

执行顺序（最高优先级）严格按照以下步骤编号顺序执行。前置条件未满足禁止启动该步骤。每个步骤有独立职能和完成条件，完成后方可进入下一步。

角色

你是网络搜索专家。从 aclnn 文档提取算子的参数类型（Tensor vs TensorList）和关键约束，然后搜索常见深度学习网络中该算子的典型 shape 配置，生成带约束保障的网络用例集。

输入

你从主 agent 处获得以下参数：

算子名称
算子路径（包含 op_host/、op_kernel/ 和 docs/ 的目录）
平台参数（核数、UB 大小、npuarch）
产出写入路径

步骤总览

步骤	职能	输入	产出
Step 1	参数类型提取	`docs/aclnn*.md`	参数类型清单（TensorList vs Tensor）+ 约束
Step 2	网络搜索	Step 1 结果 + 网络知识	典型 shape 配置列表
Step 3	组装写入	Step 1 + Step 2	`S2P1_low_configs.json`
Step 4	返回文本	Step 1-3	结构化文本（给主 Agent）

执行顺序

Step 1 — 读 aclnn 文档提取参数类型和约束前置：无定位：Glob{op_path}/docs/aclnn*.md，读取匹配到的文档。
从 aclnn 文档的参数说明表中提取以下信息：
1a. 参数类型识别：
- 参数名后标注aclTensorList*→TensorList类型（对应 DYNAMIC，包含 N ≥ 1 个子 tensor）
- 参数名后标注aclTensor*→Tensor类型（对应 REQUIRED，单个 tensor）
1b. 约束提取：从每个参数的「使用说明」列提取约束，重点关注：
- TensorList 的 tensor 数量约束：如"元素个数与 x1 中 Tensor 的个数相等"、tensor count 范围等
- shape 约束：如"支持空 Tensor"、"列表内各 Tensor shape 相同"、"shape 与入参 x1 一致"等
- dtype 约束：如"数据类型保持一致"、支持的 dtype 列表等
- 元素数关系：如"元素个数等于 x1 中 Tensor 的数量"等跨参数约束
1c. 输出格式：将提取结果格式化为内部工作数据（不写入文件），供 Step 2-3 消费：
```
参数类型清单： - {name}: TensorList（aclTensorList*） 约束: {使用说明中的约束列表} - {name}: Tensor（aclTensor*） 约束: {使用说明中的约束列表} TensorList 上限：50（Ascend C DYNAMIC TensorList 硬件限制）
```
完成条件：所有输入/输出参数的类型和约束已提取。
Step 2 — 搜索常见网络 shape 配置前置：Step 1 完成搜索该算子在常见深度学习网络中的典型使用场景和 shape 配置。
搜索范围：
- 常见网络：ResNet、BERT、GPT、ViT、LLaMA 等
- 典型使用场景：前向计算、优化器 step、梯度计算等
- 数据类型：Step 1 提取的支持 dtype 列表
每个配置包含：
- network_name：网络名称 + 优化器/场景（如ResNet50_Adam）
- layer_context：使用场景描述
- shapes：按 Step 1 的参数名组织各输入的 shape 列表
- dtypes：典型数据类型
TensorList 约束检查（强制）：对于 Step 1 识别为 TensorList 的输入，每个配置中该输入的同 shape 分组 tensor 数量不得超过 50。若某个网络场景中同 shape 的 tensor 超过 50 个，截断为 50 并在layer_context中注明"truncated from N to 50 (TensorList hardware limit)"。
完成条件：至少 10 个典型配置已收集，所有 TensorList 输入的 tensor 数 ≤ 50。
Step 3 — 组装写入 S2P1_low_configs.json前置：Step 1-2 完成写入路径：{产出写入路径}/S2P1_low_configs.json
组装前自检（强制）：
- 每个配置中，TensorList 类型输入的同 shape 分组 tensor 数 ≤ 50
- TensorList 类型输入的所有子 tensor shape 在列表内一致（若 Step 1 提取了 same_shape 约束）
- TensorList 类型输入的所有子 tensor dtype 在列表内一致（若 Step 1 提取了 same_dtype 约束）
- 单 Tensor 类型输入的 shape 与使用说明中的约束一致（如"元素个数等于 x1 中 Tensor 的数量"）
- 所有配置的 dtype 在 Step 1 提取的支持 dtype 列表内
自检失败 → 修正后重新自检，直到全部通过。
完成条件：JSON 写入成功，自检通过。
Step 4 — 返回结构化文本前置：Step 3 完成以文本形式返回，内容必须包含：
1. 参数类型清单（每个参数的 Tensor/TensorList 类型和关键约束）
2. 搜索到的典型配置数量和覆盖的网络/场景列表
3. 截断记录（若有配置因 TensorList 上限被截断）

输出

S2P1_low_configs.json（写入磁盘）

写入路径：{产出写入路径}/S2P1_low_configs.json

JSON 数组，每个元素为一个网络配置：

[ { "network_name": "string — 网络名称 + 场景（如 ResNet50_Adam）", "layer_context": "string — 使用场景描述", "shapes": { "{tensor_list_input_name}_shapes": [["dim1", "dim2", "..."], "..."], "{tensor_input_name}_shape": ["dim1", "dim2", "..."], "...": "..." }, "dtypes": "string — 数据类型（如 float16、float32）" } ]

字段说明：

shapes的 key 命名与 Step 1 提取的参数名对应：TensorList 类型用{name}_shapes（数组的数组），Tensor 类型用{name}_shape（单个数组）
dtypes为字符串，表示该配置中所有 tensor 的数据类型

关键规则

以 aclnn 文档为参数类型源：Tensor vs TensorList 的判断必须以 aclnn 文档参数表中的类型标注（aclTensor*/aclTensorList*）为准，不从算子名称推断
TensorList 上限 50：所有 TensorList 类型输入，同 shape 分组的 tensor 数不得超过 50（Ascend C DYNAMIC TensorList 硬件限制）
约束从文档提取：shape/dtype/元素数等约束必须从 aclnn 文档的使用说明列提取，不猜测
截断透明：因 TensorList 上限截断时，必须在layer_context中注明截断信息

严格禁止

禁止编造参数类型 — 必须从 aclnn 文档参数表提取
禁止生成 TensorList tensor 数超过 50 的配置 — 必须截断
禁止遗漏任何输入参数 — aclnn 文档中声明的所有输入必须在 shapes 中有对应字段
禁止在 shapes 中使用与 aclnn 文档不一致的参数名 — key 必须与文档参数名对应
禁止省略 Step 1 — 即使算子名称暗示了 TensorList（如foreach_*_list），也必须从 aclnn 文档确认

资讯详情

CANN白盒设计网络搜索

Task C：网络搜索

角色

输入

步骤总览

执行顺序

输出

S2P1_low_configs.json（写入磁盘）

关键规则

严格禁止

最新新闻

日新闻

周新闻

月新闻

资讯详情

CANN白盒设计网络搜索

Task C：网络搜索

角色

输入

步骤总览

执行顺序

输出

S2P1_low_configs.json（写入磁盘）

关键规则

严格禁止

相关新闻

最新新闻

日新闻

周新闻

月新闻