火山引擎更新6月大模型版本,开放低成本推理算力套餐 📅 2026/6/26 8:05:05 火山引擎对旗下大模型进行了六月份月度版本更新同时面向企业用户和开发者推出了普惠型推理算力配套套餐。目前行业做大模型业务普遍存在推理环节算力成本高、对接适配难度大的问题火山引擎此次更新针对性优化了模型能力以及算力相关服务能够帮助各类用户降低AI业务落地的难度。一、6月新版大模型完成能力迭代优化通用场景能力升级在本次六月份版本更新中火山引擎结合以往行业落地积累的数据调整优化了模型底层相关参数。本次更新提升了模型中文语义理解、长文本逻辑整理、多模态内容生成的基础能力优化了知识库问答、业务指令回应的适配效果能够满足企业办公互动、文案内容创作、线上智能咨询等常见业务使用。除此之外平台还优化了不同模型之间的联动能力可以实现多个模型配合调用满足企业混合部署使用的需求。推理架构轻量化改造本次更新还重点改动了模型推理架构通过优化算子、做模型量化、调整显存复用方式等技术手段减少模型运行时占用的硬件资源降低日常业务推理产生的能耗。新版本大模型可以适配轻量化算力环境运行企业不用搭建高配专属算力集群就能完成日常的模型调用工作模型本身适配普惠算力运行标准更适合中小规模用户日常使用AI相关业务。火山引擎大模型完成能力迭代优化图二、低成本推理算力套餐核心内容分层算力适配全场景使用结合用户开发测试、线上稳定运行业务、合规化生产三大使用场景火山引擎本次上线的推理算力套餐一共划分了三种使用规格能够满足个人开发者、中小微企业、监管要求较高行业这几类不同用户的使用需求。这款算力套餐没有采用大额固定算力打包付费的模式改用弹性计费方式用户可以根据自身业务需求选择算力额度随时调整使用规模适配业务不同的访问并发量。智能调度降低算力消耗该算力套餐搭载平台统一算力调度体系可分级处理紧急推理、常规推理任务错峰调配闲置算力承接非紧急业务减少算力闲置浪费。同时搭载业务缓存复用机制重复业务指令可复用历史推理数据减少重复算力消耗助力压缩业务长期使用成本保障业务运行稳定性。三、配套服务及行业应用价值合规运维配套完善本次迭代模型及推理算力服务配套标准化数据风控能力支持推理数据脱敏、调用日志溯源留存契合通用行业数据管理规范。同时配备基础运维适配服务可完成部署调试、故障排查工作降低企业AI业务运维人力投入。助力AI业务普惠落地现阶段算力成本依旧是制约中小主体大模型规模化应用的主要因素。此次模型升级叠加普惠算力开放补齐中端AI算力基础设施短板一方面助力中小企业舒缓AI数字化改造成本压力落地基础智能业务另一方面助力大型企业整合算力资源优化现有AI业务成本结构推动大模型从试点试用转向常态化业务落地。本文内容整理自火山引擎官方产品动态。