CANN/ge LLM DataDist Python专题指南

📅 2026/7/4 7:25:25

专题【免费下载链接】geGEGraph Engine是面向昇腾的图编译器和执行器提供了计算图优化、多流并行、内存复用和模型下沉等技术手段加速模型执行效率减少模型内存占用。 GE 提供对 PyTorch、TensorFlow 前端的友好接入能力并同时支持 onnx、pb 等主流模型格式的解析与编译。项目地址: https://gitcode.com/cann/geKV Cache换入换出功能介绍KV Cache换入换出指将KV Cache从Device换出到Host或者从Host换入Device。在PA场景下由于KV Cache的容量有限需要根据任务优先级执行状态等因素动态地将任务所需的KV Cache进行换入换出提高显存利用率。涉及的接口|接口名称|功能| |--|--| |CacheManager.swap_blocks|CacheManager场景下将对应block_index上的KV内存换入换出| |KvCacheManager.swap_blocks|KvCacheManager场景下将对应block_index上的KV内存换入换出|功能示例from llm_datadist import KVCache ... npu_cache kv_cache_manager.allocate_blocks_cache(npu_cache_desc, npu_cache_key) cpu_cache KvCache.create_cpu_cache(cpu_cache_desc, cpu_addrs) # cpu_addrs来自创建的cpu tensors # swap in kv_cache_manager.swap_blocks(cpu_cache, npu_cache, {1:2, 3:4}) # swap out kv_cache_manager.swap_blocks(npu_cache, cpu_cache, {1:2, 3:4})公共前缀功能介绍公共前缀指的是在一次推理过程中多个输入提示包含相同的起始部分。可用于将公共前缀产生的KV Cache内存拷贝到新的用户请求的KV Cache上进行推理。涉及的接口|接口名称|功能| |--|--| |CacheManager.copy_cache|CacheManager场景下拷贝cache。| |KvCacheManager.copy_cache|KvCacheManager场景下拷贝cache。|功能示例src_cache kv_cache_manager.allocate_cache(npu_cache_desc, npu_cache_key) # 前缀cache dst_cache kv_cache_manager.allocate_cache(npu_cache_desc, npu_cache_key) # 新的请求cache kv_cache_manager.copy_cache(dst_cache, src_cache, dst_batch_index, src_batch_index, offset, size)【免费下载链接】geGEGraph Engine是面向昇腾的图编译器和执行器提供了计算图优化、多流并行、内存复用和模型下沉等技术手段加速模型执行效率减少模型内存占用。 GE 提供对 PyTorch、TensorFlow 前端的友好接入能力并同时支持 onnx、pb 等主流模型格式的解析与编译。项目地址: https://gitcode.com/cann/ge创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

新闻详情

相关阅读

Each高级功能指南：毫秒、秒、分钟、小时时间单位的灵活配置

解决菜单开发痛点：spatie/menu的条件渲染与动态内容添加技巧

BLDC方波控制：带载启动与反电动势检测优化

PAT 乙级题目讲解：1005 《继续(3n+1)猜想》

PAT 乙级题目讲解：1008《数组元素循环右移问题》

PAT 乙级题目讲解：1004《成绩排名》

PAT 乙级题目讲解：1012《数字分类》

PAT 乙级题目讲解：1006《换个格式输出整数》

Java并发编程：Callable与ReentrantLock实战解析

洞态IAST自定义规则实战：从原理到配置，打造精准漏洞检测

无需登录本地部署Codex代理，实现DeepSeek大模型免认证调用

Playwright自动化测试实战：从零搭建现代Web测试框架

管理者的六个层次

华为OD机试2025C卷-座位调整[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

CrabCode v1.0.7与v1.0.8 更新速览！

FAE放射组学分析工具：医学影像特征探索的完整解决方案

基于Dify与DeepSeek构建私有知识库问答系统实战指南

餐饮老板必看：扫码点餐小程序3步搞定，别再让顾客干等了！