大模型已经够聪明了为什么95%的AI项目还是跑不出ROI?

📅 2026/6/17 19:35:59
大模型已经够聪明了为什么95%的AI项目还是跑不出ROI?
2026 年AI 落地的故事正在上演一个奇特的悖论模型能力突飞猛进企业 AI 投入成本与日俱增但然后呢越来越多的案例和数据显示真正进入生产并产生持续 ROI 的项目仍然是少数。Gartner 甚至预测2026 年 60% 的 AI 项目将被放弃。背后的原因不是模型不够好而是数据没有准备好被 AI 消费。当 AI 进入真实业务流程后现实的卡点是能不能拿到正确的数据、理解正确的业务语义并基于可信的数据完成任务。在 Agentic AI 时代这种矛盾被进一步放大。过去数据的消费者是人如今越来越多 Agent 开始参与分析、开发、治理等数据工作人和 Agent 需要基于同一套数据体系协同工作。如果企业还在沿用上个时代专为人而设计的数据平台很难支撑 Agent 在生产环境中稳定、准确、可信地运行。在 6 月 5 日举行的腾讯云 AI 产业应用大会上腾讯云宣布面向 Agent 升级全栈数据平台能力试图解开的正是这个结。通过生产级数据智能体 DataBuddy、数据智能平台 WeData 和 AI 原生大数据底座三层架构构建人和 Agent 协同工作的智能入口、统一控制面和数据底座。这三层架构中带给笔者最大惊喜的是 Buddy 家族的新成员——DataBuddy。因为它瞄准的是数据工作流本身。从数据工程、数据治理到数据分析数据团队最难啃的脏活累活它都按照 Agentic AI 时代的新范式重构了一遍。AI 落地是一个数据问题当行业关注点从模型能力转向 AI 落地数据成了越来越绕不开的话题。因为在真实的业务流程中不管 AI 是做经营分析、生成报表还是最终执行都需要完整跑通从数据接入到数据分析、数据治理再到最终的业务输出这样一整条链路。这中间任何一个环节的不确定都会放大结果的不可靠。然而企业现有的数据平台大多并不是为这条链路设计的。回顾大数据平台的发展历程就会发现过去 20 年大数据平台经历过两次完整的代际演进在大数据时代2006-2014重点关注的是离线数仓、ETL、报表决策把分布式存算和开发任务工具化在湖仓一体时代2014-2023重点关注的是湖仓存算、数据治理以及资产化。本质上这两个时代解决的都是 人如何更高效地使用数据 这个问题。业务方提一个数据需求分析师先理解业务口径再写 SQL 取数、对齐指标最后做出一份报表。如果底层数仓不能满足还需要数仓工程师对数仓分层做调整。这些需求从提出到交付少则两三天多则一两周。这件事过去 20 年都没怎么变。整流程虽然效率不高但基本能够运转。但当 Agent 开始开始批量上岗后数据平台终于迎来了新的使用者Agent。Agent 对数据的时效性、准确性和语义一致性提出了更高的要求原本可以依靠人工经验弥补的断层在 Agent 面前变成了硬伤。AI 时代带来了新的问题同时很多旧时代的问题如数据孤岛、治理缺失等也被再次放大。新旧问题交织在一起老办法已经不够用了。“平台效率与数据质量的短板正成为企业 AI 落地的最大瓶颈”腾讯云大数据总经理周清认为真正的 AI-Native 数据平台不等于 AI 数据平台。在 GUI 旁边加一个 Copilot 侧边栏也不会让一个平台真正进入 AI 时代。真正能带来改变的是将交互、研发、运行时、治理这四个范式同时重构交互范式在 AI 时代自然语言成为新的交互方式真正的产物是 AI 生成的UI 是 AI 产物的投影研发范式从人写代码转向 Spec-Driven从数据需求的 Spec 来驱动 AI 去理解主动生成产物人来做评审运行时范式Agent 是一等运行时公民与任务共生命周期治理范式元数据将成为 Agent 可调用的语义 API。当交互、研发、运行时和治理四个范式同时发生改变时最直观的变化将从“人使用工具”变成“Agent 完成工作”。过去大家关注数据平台有多少功能现在关注的是一项数据工作能否真正交付。DataBuddy 瞄准的是全流程和交付对比过去和现在的数据团队工作模式会发现一个非常典型的问题。过去的数据工作从需求拆解到结果分析几乎每一步都需要不同的角色在不同的系统中完成响应慢、易出错、成本高。在人机协作的 Agentic AI 时代能不能把一条数据需求变成一次端到端的交付DataBuddy 瞄准的正是这件事。DataBuddy 是腾讯云于今年 5 月发布的生产级数据智能体也是 Buddy 家族的第三位成员。如果说 CodeBuddy 面向的是开发者WorkBuddy 面向的是职场人士那么 DataBuddy 面向的就是企业数据基础设施建设中最重要的角色数据分析师、数据治理人员、数仓工程师。它基于腾讯 WorkBuddy 同源 Agent 底层能力打造继承了 WorkBuddy 的 Harness。 第三方数据显示WorkBuddy 已经成为当前国内日活跃用户数DAU第一的效率型 Agent这也从侧面印证了整套 Agent 底层架构的稳定性。DataBuddy 相当于站在 WorkBuddy 的肩膀上复用了这套经过海量用户验证的成熟 Agent 底层架构。同时DataBuddy 还 通过 Skill 引入腾讯云大数据服务内外部十几年大规模经验以及与数据智能平台 WeData 原生深度联动最终实现数据垂直领域的 Agent 化。据介绍DataBuddy 一共内置了三个数据专家能够针对数据工程、数据治理、数据分析三大数据场景实现对话即交付。用户只需要通过自然语言对话就能端到端完成大数据全链路任务。在数据工程场景中过去完全依靠人工搭建现在 DataBuddy 能自动完成数仓方案设计、代码生成和工作流编排将重复开发工作量降低 80%整体研发效率提升 5-10 倍。重点不是快了而是人不再需要关心中间每一步怎么做新手就能直接起步。比如在这个案例中只需要几句话就能让 DataBuddy 基于数据源内的原始表从 0 到 1 设计数仓建设方案。甚至还能生成项目规范并根据项目规范更新技术方案。此外DataBuddy 还提供完整的 AIOps 能力能自动解析日志、代码、资源、上游依赖分析失败原因输出根因判断再基于内置的运维知识库及 Skills推荐可信的修复方案一键执行修复。在数据治理场景中过去是人工治理敏感数据靠人工标记质量规则凭经验拍脑袋问题诊断止于“表象”人工巡检覆盖率低。DataBuddy 的打法是以 AI 实现智能守护。可以在没有预设规则的条件下自主分析数仓中存在的问题输出完整的质量报告。比如它会分析哪些是敏感字段需要脱敏哪些字段在业务层面不合逻辑等等。在上面这个案例中DataBuddy 能根据信息输出当前数仓数据治理情况的分析报告如果遇到元数据不完整或数据质量没有监控到的能够自动推荐处理策略用户确认后即可自动执行。最终生成数仓数据治理分析报告非常详实覆盖元数据完整性、血缘健康度、语义模型一致性、数据质量、数据安全合规以及存储与成本六大维度。在治理改进建议与推荐策略中还按照紧急程度进行了划分哪些需要立即处理的哪些可以晚点处理的都呈现得明明白白。在数据分析场景中过去业务提一个需求排期可能得等上 1-3 天报告完全依靠人工制作异动归因靠经验费时费力。DataBuddy 充当的是一个随身的数据分析师角色。它能实现对话即交付不会写 SQL 的业务人员和分析师也能用 DataBuddy 实现智能问数、指标归因分析、报告生成和可视化看板搭建。同时结合 WeData 的数据语义层DataBuddy 能大提升准确性解决数据口径问题。比如在这个案例中DataBuddy 能快速对 1000 个游戏用户进行行为分析。最终生成的分析报告不仅有核心总结还有下一步的建议动作参考指数非常高。大家对 Data Agent 的期待从来不是一个只能对话的 ChatBot而是一个能够直接参与业务交付的数据 Agent。从 DataBuddy 落地的三大场景来看它瞄准的正是交付这件事。但当 Agent 开始分析数据、调用工具甚至参与业务决策时企业最担心的往往不再是能力而是边界。根据 Gartner 调研75% 的企业已经在组织内部试点、部署或使用某种形式的 AI Agent但只有 15% 正在考虑或部署真正具备自主能力的 Agent。相比模型能力本身企业更关心的是另一个问题Agent 能否在可控范围内运行为什么多数 Data Agent 项目都止步于幻觉2026 年幻觉仍是 AI 最大的顽疾。过去一年很多企业的 Data Agent 项目最后都止步于“幻觉” 。“如果底层数据没准备好上面跑什么 Agent 都是白搭。”腾讯云 WeData 产品总监唐晨表示当下 Agent 存在两种路线一种是 Wrapper 型 Agent这种 Agent 实际是大模型套壳没有数据底座也就决定了它的上限不会太高另一种是数据平台原生 Agent更像是数据平台在 AI 时代的有机延伸。DataBuddy 属于后者它完全搭载在腾讯云全新升级的一站式数据智能平台 WeData 上。真正值得关注的不是产品增加了多少功能而是腾讯云在这次升级背后对 DataAI 时代企业数据平台演进方向的判断Agentic AI 时代的数据平台www.jpbara.com可能需要按照全新的范式重构。正如前文所说数据平台的消费者已经从人变成了 Agent。数据平台承担的也不再只是传统的元数据管理而是直接决定 Agent 会不会产生幻觉。腾讯云认为统一语义正在成为 AI 时代新的数据护城河。没有统一语义NL2SQL 会反复掉进三个陷阱指标歧义系统里一个“收入”有八种口径Agent 随机选一个JOIN 错乱关联键靠猜SQL 跑得通但数据全错查询条件随意匹配比如过滤条件是“上季度”或者“华东区”大模型很难理解“华东区”到底指什么。这也是多数 Data Agent 项目止步于幻觉的根因。但语义本身并不是一个孤立模块。要让 Agent 真正做到可信、可控、可交付还需要能够访问数据、调用能力、执行任务并最终进入生产环境。这也从侧面解释了为什么腾讯云没有把 DataBuddy 设计成一个独立的 Agent 产品而是把它放进了整个 WeData 的架构体系中。从架构上来看DataBuddy 位于三层架构的顶层即应用层包括三类原生 Agent、Memory Skill Store、MCP 协议层。在它下面一层叫做治理层或数据层解决的是 AI-Ready 最关键的 Unity Catalog、统一语义、MCP。把平台所有的能力、数据通过 MCP、Skills 暴露出来最终让 Agent 能调得到、读得懂、用得对。再往下是工程层即 DIOps 全栈工程。用统一的 IDE 把数据负载和 AI 负载放在同一个 Workflow 里编排再通过 Bundle 的发布机制解决开发到生产的发布问题使得生产更加严谨、可信。从应用层到数据层再到工程层三层缺一不可。工程层接住任务治理层接住语义应用层接住对话理解用户的意图。三层加在一起才是数据平台 Agent-Native 真正的形态。 这也解释了为什么DataBuddy 能在 WeData 上跑得起来。把这套架构放到真实的业务场景中价值体现得会更加清晰。以新零售行业为例这个行业的瓶颈从来不是数据太少而是数据太散、报表太慢。线上线下、ERP、CRM 的数据分散在不同系统中BI 的时效性跟不上大促节奏。此外AI 模型上线慢推荐系统和用户分群模型从开发到投产动辄需要 1-2 个月。非结构化数据也用不起来商品图、客服对话、用户评价沉淀在对象存储或者其他系统里面无法跟大数据系统打通缺少数据准备的链路没法喂给 RAG。WeData 通过全域数据接入和多源异构集成把分散的全域数据收拢成一份统一口径让大促决策从“等报表”变成“实时看”。其中Unity Catalog 做全域血缘能从一张报表追到上游每一张表从 GMV、复购率、转化率到 ROI统一指标口径 MLOps 全闭环承接推荐、用户增长、智能补货模型最上面的 DataBuddy能让企业用自然语言直接问数。基于这一套方案WeData 把“全域数据 智能模型 业务决策”打造成了一条工程化流水线数据资产可以复用营销 ROI 可以持续量化优化。当 AI 落地的真正瓶颈来到数据层所有数据平台都值得按照 Agentic AI 时代新的范式要求重新做一遍。本质上腾讯云这次升级就是在从两个视角回答同一个问题Agentic AI 时代的数据平台到底应该长什么样DataBuddy 回答的是“Agent 能做什么”WeData 回答的是“为 Agent 准备了什么底座”。两个视角加在一起构成了 Agentic AI 时代企业数据智能平台的完整方案。如果把这次升级放在更长的时间轴上看它代表的或许是一次人机分工的重新划线。过去数据平台是为人设计的操作台现在Agent 正在成为合法的“一等用户”。而这场变化才刚刚开始。