大模型没有终局:Scaling Law、具身智能与中国AI的路径选择

📅 2026/6/16 18:46:34
大模型没有终局:Scaling Law、具身智能与中国AI的路径选择
大模型没有终局Scaling Law、具身智能与中国AI的路径选择先说结论Scaling Law未失效但已从纯语言转向多模态和具身智能数据源头从互联网文本扩展到合成数据、人类视频。具身智能的护城河在于数据闭环、软硬协同和完整交付体系WAM范式通过无动作标签数据大幅提升scaling潜力。中国AI的优势在于供应链完整、场景丰富和年轻人才具身智能可能成为类似AlphaGo的突破点。从技术从业者视角拆解圆桌共识与分歧聚焦Scaling Law的真实边界、具身智能的数据困境、以及中国AI的制造业优势如何落地。大模型行业最近两年一直在争论一个问题Scaling Law是不是走到头了去年很多人看到纯语言模型预训练数据快用完了后训练和推理优化成了主流就下结论说“大模型趋同没有护城河”。但2026年智源大会上的这场圆桌几位嘉宾的判断出奇一致Scaling Law还远没到终点但形态变了从纯粹的语言模型扩展到了多模态、具身智能甚至世界模型。先说结论如果你还在纠结“大模型有没有长期壁垒”不如先看清楚——真正的壁垒不在模型参数本身而在数据闭环、软硬协同和垂直场景的极致深耕。Scaling Law没有失效只是换了个方向智源研究院院长王仲远说得直接去年讨论Scaling Law失效是因为互联网文本数据确实用完了。但技术一旦跳出自监督预训练的单一范式后训练强化学习、agentic学习立刻带来了新一波能力提升。更关键的是多模态的Scaling范式也在被验证——智源的Emu3系列用不到1%的数据和百亿参数规模已经看到了性能提升。面壁智能CEO李大海则从另一个角度补充大模型的智能可以拆成“知识密度×参数量”。知识密度在不断提升量化技术、模型结构优化参数量也在涨——只是端侧模型受硬件限制看起来涨得慢。去年只能落1B今年到4B明年可能到几十B。这不是Scaling失效是物理条件在拖后腿。所以Scaling Law没有失效只是它不再是一条靠堆文本就能增长的线性曲线。它需要更多样的数据来源、更复杂的训练范式以及软硬件的协同设计。具身智能从VLA到WAM数据不再是瓶颈银河通用CTO王鹤的分享是最可能引起争议的。他在圆桌上提出具身智能已经进入WAMWorld Action Model范式超越了此前的VLA视觉语言动作模型。VLA的核心问题是所有训练数据都需要动作标签比如人的示范操作。这个成本极高很难scale。而WAM的核心突破是不需要动作标签。它只需要第一视角的人类视频就能学到“大致的动作流”从而进行预训练。王鹤拿他们2025年初的GRASP VLA工作举例用10亿帧仿真数据模型在真实世界可以零样本抓取任何物体。这个效果到现在没被超越。但再往前如果每个技能都靠仿真数据堆何时能覆盖完WAM的答案是把“看人做事”的视频直接拿来训练数据源从机器人扩展到了全人类。这里其实有个边界没说透WAM虽然解决了数据来源问题但从“看”到“做”的转化质量如何保证圆桌上王鹤也承认目前WAM还处在“GPT-1到GPT-2”的阶段距离ChatGPT时刻还需要千万小时高质量数据和百亿以上年投入。所以具身智能的Scaling是真的在加速但代价也极其明确需要巨额资金、高质量数据、软硬件协同设计以及完整的交付链。这不是几个人在车库里能做的事。端侧模型的scaling空间硬件和量化技术同步推进李大海提到的“知识密度定律”在整个圆桌中算是最具实操性的框架。面壁智能给主机厂落地的端侧模型从1B涨到4B看似慢但背后是量化技术、模型结构压缩的合力。很多人觉得端侧模型火是因为云端太贵李大海直接给了个算账逻辑在中国用户买手机、买汽车是买断制不会每个月给厂商交订阅费。所以设备厂商想在端上提供AI体验就必须把大部分推理成本压在本地。云端只处理端侧做不了的任务。这个逻辑非常现实。它说明端侧模型的Scaling不是单纯的参数增长而是配合硬件升级更大内存、更快NPU和算法优化量化、蒸馏、稀疏化的阶梯式提升。明年端侧模型冲到几十B并不奇怪只要硬件算力跟得上。安全责任技术发展必然伴随“吃一堑长一智”Agent出错谁来负责王仲远拿自动驾驶做类比认为会走“边实践边完善”的路。王鹤说得更具体在工业场景里责任划分已经很清楚——机器人做不到和人一样好就按经济合同罚。但在复杂决策场景中权责划分将逐步探索。李大海的回应最有意思“人类社会发展就是建立在吃一堑长一智的范式上。”飞机上的安全规定来自空难交通限速来自事故。AI也会经历同样过程——先出问题再总结规范。好消息是AI辅助的安全排查效率更高代价可能比以往更小。这不是和稀泥。从技术落地角度看安全责任永远无法提前完美设计只能通过案例积累逐步完善。如果你在做Agent产品别等监管出全细则再动手先在小范围内试错并做好数据沉淀。中国AI的独特路径供应链、场景与年轻人才圆桌最后一个问题是中国AI跟欧美AI最终会走出什么不同三位嘉宾的答案几乎重叠供应链、场景、人才。王仲远强调中国制造业和市场规模足以孵化独特技术王鹤直接放话具身智能的AlphaGo和ChatGPT moment会出现在中国然后从1到100加速成熟李大海补充——中国拥有的年轻AI人才数量全球最大这是最底层的优势。这个判断值得认真对待。当欧美在Coding、基础模型上持续领先时中国在具身智能、工业机器人、供应链整合上确实有不可替代的土壤。如果你在考虑AI创业方向与其卷Coding大模型不如看看哪些场景能利用“中国制造AI”的交叉地带——比如仓储物流、医疗辅助、服务业硬件。总结与建议这场圆桌没有给出简单的“All in 云端”或“All in 具身”的结论。更现实的判断是Scaling Law依然成立但玩法变了——你需要关注数据多样性、训练范式融合和软硬件协同。具身智能的WAM范式很性感但门槛极高适合有资金积累和技术实力的团队。端侧模型的机会在于“低成本场景绑定”关键是算好Token经济学。安全责任不是技术问题是管理问题早期产品要预留容错和迭代空间。做一个具体的提问如果你现在要做一款配送机器人你是选择自研WAM模型还是集成现有VLA模型并优化硬件结构这两种选择的投入和风险差一个数量级。聊聊。最后留一个讨论点如果你做具身智能会优先选择合成数据scaling抓取等单一技能还是直接押注WAM通用范式为什么