CANN/Ascend C SIMD矢量数据搬运API

📅 2026/6/19 6:28:33
CANN/Ascend C SIMD矢量数据搬运API
asc_set_ub2gm_loop_size【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言原生支持C和C标准规范主要由类库和语言扩展层构成提供多层级API满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit产品支持情况产品是否支持Ascend 950PR/Ascend 950DT√功能说明将数据从Unified Buffer (UB)搬运到Global Memory (GM)时通过调用该接口设置内层循环和外层循环的次数。以源操作数搬运场景为例如下图所示。函数原型__aicore__ inline void asc_set_ub2gm_loop_size(uint32_t loop1_size, uint32_t loop2_size)参数说明参数名输入/输出描述loop1_size输入用于设置内层循环的循环次数取值范围为[0, 2^21)。loop2_size输入用于设置外层循环的循环次数取值范围为[0, 2^21)。返回值说明无流水类型PIPE_S约束说明每次设置循环相关参数后需要进行寄存器的复位循环次数设置为1否则会影响下一次搬运的使用。调用示例uint32_t loop1_size 2; uint32_t loop2_size 2; uint64_t loop1_src_stride 96; uint64_t loop1_dst_stride 128; uint64_t loop2_src_stride 192; uint64_t loop2_dst_stride 288; asc_set_ub2gm_loop_size(loop1_size, loop2_size); asc_set_ub2gm_loop1_stride(loop1_src_stride, loop1_dst_stride); asc_set_ub2gm_loop2_stride(loop2_src_stride, loop2_dst_stride); asc_copy_ub2gm_align(dst, src, 2, 48 * sizeof(int8_t), 0, 0, 0); asc_set_ub2gm_loop_size(1, 1);【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言原生支持C和C标准规范主要由类库和语言扩展层构成提供多层级API满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考