CANN文档-NPU_COLLECT_PATH环境变量说明

📅 2026/7/5 18:45:57
CANN文档-NPU_COLLECT_PATH环境变量说明
NPU_COLLECT_PATH【免费下载链接】docs该仓库用于维护cann公共文档项目地址: https://gitcode.com/cann/docs功能描述在复现问题场景下使用该环境变量指定故障信息包括dump图、AI Core算子异常数据、算子编译信息等的保存路径可配置为绝对路径或相对路径此处是相对执行程序或命令的路径执行用户需对该路径具有读、写、可执行权限若路径不存在系统会自动创建该路径中的目录。注意使用该环境变量需关注以下事项设置该环境变量默认自动开启异常算子dump数据采集功能。如果算子输入或输出包含用户的敏感信息则存在信息泄露风险。设置该环境变量之后转换模型在编译om模型时会增加调试信息导致om模型文件增大若关注内存规划或内存资源有限时则在调试完成后及时删除该环境变量。设置该环境变量仅收集L1 exception dump信息不收集模型Dump信息、单算子Dump信息、溢出算子Dump信息、L0 exception dump信息。L1 exception dump信息存放目录的优先级从高到低依次为NPU_COLLECT_PATH - ASCEND_WORK_PATH - 默认路径指执行程序的当前路径的extra-info目录L1 exception dump是普通exception dumpL0 exception dump是Lite exception dump即轻量化的exception dump两者都会导出算子输入输出、workspace数据等信息但相比L0 exception dumpL1 exception dump的信息更多开启L1 exception dump时会在Host应用类日志文件即plog日志中打印出各tensor的dtype等信息还会把算子相关的算子名、kernel都打印出来。设置该环境变量模型编译时会在线编译算子不再使用已编译好的算子二进制文件。在线编译的算子信息.o和.json文件存放目录的优先级从高到低依次为NPU_COLLECT_PATH - ASCEND_CACHE_PATH - 默认路径指${HOME}/atc_data目录配置示例export NPU_COLLECT_PATH$HOME/demo/使用约束当调用单算子API例如aclnn类API时会使用已编译好的算子二进制文件不涉及在线编译算子。若配置NPU_COLLECT_PATH环境变量图模式下涉及以下算子在该环境变量指定的路径下无法生成算子编译文件包括.o和.json文件。MatMulAllReduceMatMulAllReduceAddRmsNormAllGatherMatMulMatMulReduceScatterAlltoAllAllGatherBatchMatMulBatchMatMulReduceScatterAlltoAll若配置NPU_COLLECT_PATH环境变量不支持打开“检测Global Memory是否内存越界”的开关否则编译出来的模型文件或算子kernel包在使用时会报错。打开“检测Global Memory是否内存越界”的开关有以下方式使用ATC模型转换工具时在--op_debug_config参数指定的配置文件中配置oom详细配置请参见《ATC离线模型编译工具》。使用op_compiler算子编译工具时在--op_debug_config参数指定的配置文件中配置oom详细配置请参见《算子编译工具》。使用Ascend Graph方式构图时在op_debug_config或OP_DEBUG_CONFIG参数指定的配置文件中配置oom详细配置请参见《图开发》。基于TensorFlow的Python API开发的训练脚本迁移到AI处理器上执行训练时将op_debug_config参数指定的配置文件中配置oom详细配置请参见《TensorFlow 1.15模型迁移》、《TensorFlow 2.6.5模型迁移》。【免费下载链接】docs该仓库用于维护cann公共文档项目地址: https://gitcode.com/cann/docs创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考