CANN/GE单算子图构建与Dump接口

📅 2026/6/20 17:28:12

aclGenGraphAndDumpForOp【免费下载链接】geGEGraph Engine是面向昇腾的图编译器和执行器提供了计算图优化、多流并行、内存复用和模型下沉等技术手段加速模型执行效率减少模型内存占用。 GE 提供对 PyTorch、TensorFlow 前端的友好接入能力并同时支持 onnx、pb 等主流模型格式的解析与编译。项目地址: https://gitcode.com/cann/ge产品支持情况产品是否支持Atlas A3 训练系列产品 / Atlas A3 推理系列产品√Atlas A2 训练系列产品 / Atlas A2 推理系列产品√功能说明构建单个算子的图并Dump生成.txt文件。此处的图是指表达算子IRIntermediate Representation的结构图编译过程中由于融合、拆分等原因会导致图不断变换、进而生成新的图这些变换的目的是为了将用户表达的图适配到昇腾AI处理器上获得更高性能。使用场景算子调优场景下调用本接口构建单个算子的图并Dump生成.txt文件作为算子调优的输入数据之一。函数原型aclError aclGenGraphAndDumpForOp(const char *opType, int numInputs, const aclTensorDesc *const inputDesc[], const aclDataBuffer *const inputs[], int numOutputs, const aclTensorDesc *const outputDesc[], aclDataBuffer *const outputs[], const aclopAttr *attr, aclopEngineType engineType, const char *graphDumpPath, const aclGraphDumpOption *graphDumpOpt)参数说明参数名输入/输出说明opType输入指定算子类型名称的指针。numInputs输入算子输入tensor的数量。inputDesc输入算子输入tensor描述的指针数组。需提前调用aclCreateTensorDesc接口创建aclTensorDesc类型。inputDesc数组中的元素个数必须与numInputs参数值保持一致且inputs数组与inputDesc数组中的元素必须一一对应。inputs输入算子输入tensor的指针数组。需提前调用aclCreateDataBuffer接口创建aclDataBuffer类型的数据。inputs数组中的元素个数必须与numInputs参数值保持一致且inputs数组与inputDesc数组中的元素必须一一对应。numOutputs输入算子输出tensor的数量。outputDesc输入算子输出tensor描述的指针数组。需提前调用aclCreateTensorDesc接口创建aclTensorDesc类型。outputDesc数组中的元素个数必须与numOutputs参数值保持一致且outputs数组与outputDesc数组中的元素必须一一对应。outputs输入算子输出tensor的指针数组。需提前调用aclCreateDataBuffer接口创建aclDataBuffer类型的数据。outputs数组中的元素个数必须与numOutputs参数值保持一致且outputs数组与outputDesc数组中的元素必须一一对应。attr输入算子属性的指针。需提前调用aclopCreateAttr接口创建aclopAttr类型。engineType输入算子执行引擎。graphDumpPath输入Dump单算子图所生成的文件文件名后缀为.txt的保存路径的指针。路径需要由用户提前创建路径中如果不指定文件名则由接口内部指定文件名。如果多次Dump时指定同一个路径且文件名相同则最新一次的文件会覆盖之前的文件。graphDumpOpt输入单算子图的dump选项的指针。当前该参数预留仅支持传入nullptr。返回值说明返回0表示成功返回其他值表示失败请参见aclError。【免费下载链接】geGEGraph Engine是面向昇腾的图编译器和执行器提供了计算图优化、多流并行、内存复用和模型下沉等技术手段加速模型执行效率减少模型内存占用。 GE 提供对 PyTorch、TensorFlow 前端的友好接入能力并同时支持 onnx、pb 等主流模型格式的解析与编译。项目地址: https://gitcode.com/cann/ge创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

新闻详情

相关阅读

Allure测试报告实战指南：从pytest集成到CI/CD部署

javalang高级用法：10个实用技巧实现Java代码重构与自动化重构

Onekey Steam清单下载器：3分钟学会游戏文件备份与管理

Windows OpenSSH 管理员账号免密登录配置与排错

嵌入式开发实战：P89LPC932A1的ISP与IAP技术详解

掌握AI专著写作技巧，用AI工具3天写出20万字专著！

嵌入式GUI显示驱动与VNC服务器：从硬件加速到远程调试实战

5秒无损转换B站缓存视频：m4s-converter快速入门指南

6.19 esp32s3学习

HarmonyOS6踩坑记录之Navigation + Tabs 嵌套后路由栈全乱了？每个 Tab 独立 NavPathStack 才是正解

MCU系统集成模块(SIM)详解：复位、中断与低功耗管理实战

目标检测进阶：从IoU到CIoU，边框回归损失函数演进全解析与实战对比