CANN/ge LLM数据分布传输缓存键配置

📅 2026/7/4 9:22:41

# TransferWithCacheKeyConfig【免费下载链接】geGEGraph Engine是面向昇腾的图编译器和执行器提供了计算图优化、多流并行、内存复用和模型下沉等技术手段加速模型执行效率减少模型内存占用。 GE 提供对 PyTorch、TensorFlow 前端的友好接入能力并同时支持 onnx、pb 等主流模型格式的解析与编译。项目地址: https://gitcode.com/cann/ge产品支持情况Atlas A3 训练系列产品/Atlas A3 推理系列产品支持Atlas A2 推理系列产品支持Atlas A2 训练系列产品不支持函数功能构造TransferWithCacheKeyConfig。函数原型__init__(cache_key: Union[BlocksCacheKey, CacheKeyByIdAndIndex], src_layer_range: range None, dst_layer_range: range None, src_batch_index: int 0)参数说明参数名数据类型取值说明cache_keyUnion[BlocksCacheKey, CacheKeyByIdAndIndex]目的Cache所在实例的cluster_id。src_layer_rangerange必选参数本地要传输的层的范围step只支持为1。dst_layer_rangerange必选参数远端要传输的层的范围step只支持为1。src_batch_indexint本地cache的batch下标。当源Cache为非PA场景时可以设置。调用示例from llm_datadist import TransferWithCacheKeyConfig TransferWithCacheKeyConfig(BlocksCacheKey(1), range(0, 40), range(0, 40))返回值正常情况下返回TransferWithCacheKeyConfig的实例。参数错误可能抛出TypeError、ValueError或LLMException。约束说明src_layer_range表示范围需等于dst_layer_range表示范围。cache_key为BlocksCacheKey时src_batch_index只能为0。【免费下载链接】geGEGraph Engine是面向昇腾的图编译器和执行器提供了计算图优化、多流并行、内存复用和模型下沉等技术手段加速模型执行效率减少模型内存占用。 GE 提供对 PyTorch、TensorFlow 前端的友好接入能力并同时支持 onnx、pb 等主流模型格式的解析与编译。项目地址: https://gitcode.com/cann/ge创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

新闻详情

相关阅读

Mhook源码剖析：从汇编到C++的Hook实现细节

uiv日期选择器组件深度解析：从基础使用到高级配置

大模型真实业务能力横评：财务尽调、客服FAQ、研发周报与多语言改写四大场景实测

PUBG罗技鼠标宏终极指南：5分钟掌握精准压枪技巧

Wireshark实战：IPv6邻居发现协议与扩展头深度解析

2026大模型选型核心：服务基座四层评估法

AI 后端会话网关：上下文管理要比模型调用更早设计

1万亿对向量相似度计算的工程实战指南

openEuler社区治理效率提升50%：Wiki机器人使用技巧与最佳实践

洞态IAST自定义规则实战：从原理到配置，打造精准漏洞检测

无需登录本地部署Codex代理，实现DeepSeek大模型免认证调用

Playwright自动化测试实战：从零搭建现代Web测试框架

管理者的六个层次

华为OD机试2025C卷-座位调整[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

CrabCode v1.0.7与v1.0.8 更新速览！

FAE放射组学分析工具：医学影像特征探索的完整解决方案

基于Dify与DeepSeek构建私有知识库问答系统实战指南

餐饮老板必看：扫码点餐小程序3步搞定，别再让顾客干等了！