CANN/docs 异步模型推理

📅 2026/7/5 19:34:54

异步模型推理【免费下载链接】docs该仓库用于维护cann公共文档项目地址: https://gitcode.com/cann/docs本节介绍异步推理接口如何与回调函数配合使用每隔一段时间下发一次回调任务获取前一段时间内的异步推理结果。接口调用流程开发应用时如果涉及异步场景下的同步等待则应用程序中必须包含相关的代码逻辑关于该场景的接口调用流程请参见下图。图 1同步等待流程Callback场景![](https://raw.gitcode.com/cann/docs/raw/a173bdbfa81bbfd36d1c4da672d78301fb678d36/docs/app-dev/zh/figures/同步等待流程Callback场景.png 同步等待流程Callback场景?utm_sourcegitcode_repo_files)关键接口说明如下回调函数需由用户提前创建用于获取并处理模型推理或算子执行的结果。线程需由用户提前创建并自定义线程函数在线程函数内调用aclrtProcessReport接口设置超时时间等待aclrtLaunchCallback接口下发的回调任务执行。调用aclrtSubscribeReport接口指定处理Stream上回调函数的线程线程与第2步中创建的线程保持一致。异步推理时调用aclmdlExecuteAsync接口。对于异步接口还需调用aclrtSynchronizeStream接口阻塞应用程序运行直到指定Stream中的所有任务都完成。用户可以在aclrtSynchronizeStream接口之后一次性获取所有图片的异步推理结果但如果图片数据量较大的情况下需要等待的时间比较长这时可以使用Callback功能每隔一段时间下发一次Callback任务获取前一段时间内的异步推理结果。调用aclrtLaunchCallback接口在Stream的任务队列中下发一个回调任务系统内部在执行到该回调任务时会在Stream上注册的线程通过aclrtSubscribeReport接口注册的线程中执行回调函数回调函数与第1步中的回调函数保持一致。每调用一次aclrtLaunchCallback接口就会触发一次回调函数的执行。调用aclrtUnSubscribeReport接口取消线程注册Stream上的回调函数不再由指定线程处理。示例代码以下是异步模型推理功能关键步骤的代码示例不能直接拷贝编译运行仅供参考。调用接口后需增加异常处理的分支并记录报错日志、提示日志此处不一一列举。您可以单击resnet50_async_imagenet_classification获取样例。#include acl/acl.h ...... // 获取当前AI软件栈的运行模式根据不同的运行模式后续的内存申请、内存复制等接口调用方式不同 aclrtRunMode runMode; extern bool g_isDevice; aclrtGetRunMode(runMode); g_isDevice (runMode ACL_DEVICE); // 1. 申请模型推理资源 // 此处的..表示相对路径相对可执行文件所在的目录 // 例如编译出来的可执行文件存放在out目录下此处的..就表示out目录的上一级目录 const char* omModelPath ../model/resnet50.om; // 1.1 加载模型 // 根据模型文件获取模型执行时所需的权值内存大小、工作内存大小并申请权值内存、工作内存 aclmdlQuerySize(omModelPath, modelMemSize_, modelWeightSize_); aclrtMalloc(modelMemPtr_, modelMemSize_, ACL_MEM_MALLOC_HUGE_FIRST); aclrtMalloc(modelWeightPtr_, modelWeightSize_, ACL_MEM_MALLOC_HUGE_FIRST); // 加载离线模型文件模型加载成功返回标识模型的ID。 aclmdlLoadFromFileWithMem(modelPath, modelId_, modelMemPtr_, modelMemSize_, modelWeightPtr_, modelWeightSize_); // 1.2 根据模型的ID获取该模型的描述信息 modelDesc_ aclmdlCreateDesc(); aclmdlGetDesc(modelDesc_, modelId_); // 1.3 自定义函数InitMemPool初始化内存池存放模型推理的输入数据、输出数据 // -----自定义函数InitMemPool内部的关键实现----- string testFile[] { ../data/dog1_1024_683.bin, ../data/dog2_1024_683.bin }; size_t fileNum sizeof(testFile) / sizeof(testFile[0]); // g_memoryPoolSize表示内存池中的内存块的个数默认为100个 for (size_t i 0; i g_memoryPoolSize; i) { size_t index i % (sizeof(testFile) / sizeof(testFile[0])); // model process uint32_t devBufferSize; // 自定义函数GetDeviceBufferOfFile完成以下功能 // 获取存放输入图片数据的内存及内存大小、将图片数据传输到Device void *picDevBuffer Utils::GetDeviceBufferOfFile(testFile[index], devBufferSize); aclmdlDataset *input nullptr; // 自定义函数CreateInput创建aclmdlDataset类型的数据input用于存放模型推理的输入数据 Result ret CreateInput(picDevBuffer, devBufferSize, input); aclmdlDataset *output nullptr; // 自定义函数CreateOutput创建aclmdlDataset类型的数据output用于存放模型推理的输出数据modelDesc表示模型的描述信息 CreateOutput(output, modelDesc); { std::lock_guardstd::recursive_mutex lk(freePoolMutex_); freeMemoryPool_[input] output; } } // -----自定义函数InitMemPool内部的关键实现----- // 2 模型推理 // 2.1 创建线程tid并将该tid线程指定为处理Stream上回调函数的线程 // 其中ProcessCallback为线程函数在该函数内调用aclrtProcessReport接口等待指定时间后触发回调函数处理 pthread_t tid; (void)pthread_create(tid, nullptr, ProcessCallback, s_isExit); // 2.2 指定处理Stream上回调函数的线程 aclrtSubscribeReport(tid, stream_); // 2.3 创建回调函数用户处理模型推理的结果由用户自行定义 void ModelProcess::CallBackFunc(void *arg) { std::mapaclmdlDataset *, aclmdlDataset * *dataMap (std::mapaclmdlDataset *, aclmdlDataset * *)arg; aclmdlDataset *input nullptr; aclmdlDataset *output nullptr; MemoryPool *memPool MemoryPool::Instance(); for (auto data : *dataMap) { ModelProcess::OutputModelResult(data.second); memPool-FreeMemory(data.first, data.second); } delete dataMap; } // 2.4 自定义函数ExecuteAsync执行模型推理 // -----自定义函数ExecuteAsync内部的关键实现开始----- // g_callbackInterval表示callback间隔默认为1表示1次异步推理后下发一次callback任务 bool isCallback (g_callbackInterval ! 0); size_t callbackCnt 0; std::mapaclmdlDataset *, aclmdlDataset * *dataMap nullptr; aclmdlDataset *input nullptr; aclmdlDataset *output nullptr; MemoryPool *memPool MemoryPool::Instance(); // g_executeTimes表示执行模型异步推理的次数默认为100次 for (uint32_t cnt 0; cnt g_executeTimes; cnt) { if (memPool-mallocMemory(input, output) ! SUCCESS) { ERROR_LOG(get free memory failed); return FAILED; } // 执行异步推理 aclError ret aclmdlExecuteAsync(modelId_, input, output, stream_); if (isCallback) { if (dataMap nullptr) { dataMap new std::mapaclmdlDataset *, aclmdlDataset *; if (dataMap nullptr) { ERROR_LOG(malloc list failed, modelId is %u, modelId_); memPool-FreeMemory(input, output); return FAILED; } } (*dataMap)[input] output; callbackCnt; if ((callbackCnt % g_callbackInterval) 0) { // 在Stream的任务队列中增加一个需要执行的回调函数 ret aclrtLaunchCallback(CallBackFunc, (void *)dataMap, ACL_CALLBACK_BLOCK, stream_); if (ret ! ACL_SUCCESS) { ERROR_LOG(launch callback failed, index%zu, callbackCnt); memPool-FreeMemory(input, output); delete dataMap; return FAILED; } dataMap nullptr; } } } // -----自定义函数ExecuteAsync内部的关键实现结束----- // 2.5 对于异步推理需阻塞应用程序运行直到指定Stream中的所有任务都完成 aclrtSynchronizeStream(stream_); // 2.6 取消线程注册Stream上的回调函数不再由指定线程处理 aclrtUnSubscribeReport(static_castuint64_t(tid), stream_); s_isExit true; (void)pthread_join(tid, nullptr); ......【免费下载链接】docs该仓库用于维护cann公共文档项目地址: https://gitcode.com/cann/docs创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

新闻详情

相关阅读

破解百度网盘转存限制：BaiduPCS-Go批量转存架构深度解析与性能优化

activerecord-multi-tenant 核心组件深度解析：从 Model Extensions 到 Query Rewriter

使用TRT-LLM部署Laguna XS 2.1：NVIDIA GPU优化终极指南 [特殊字符]

Pytest自动化测试：从核心原理到实战应用的全方位指南

用C#编写语音自动朗读机器人

终极指南：在Windows上完美驱动Apple触控板的完整解决方案

Windows任务栏终极清理指南：用RBTray一键隐藏窗口到系统托盘

React Server Components安全漏洞CVE-2025-55182深度剖析与防御实践

星露谷物语终极MOD指南：5个步骤打造智能自动化农场

acme.sh私钥加密存储：基于OpenSSL的自动化证书安全管理方案

免费二维码修复工具终极指南：三步拯救损坏二维码

星露谷物语终极MOD指南：5个步骤打造智能自动化农场

3步彻底解决Windows右键菜单混乱问题：ContextMenuManager使用全攻略

从GitHub安全案例解析常见漏洞与防护实践

MLT 2026启示：因果推理与概率建模驱动下一代LLM应用

FAE放射组学分析工具：医学影像特征探索的完整解决方案

基于Dify与DeepSeek构建私有知识库问答系统实战指南

餐饮老板必看：扫码点餐小程序3步搞定，别再让顾客干等了！