GLM5.2超过Opus4.8Think，全球第二了！

📅 2026/6/17 14:23:13

关于 GLM5.2 我已经测过很多并且写过一篇非常长的文章了。我的结论是绝对干不过 Opus4.8所以要是不加前提地说“GLM5.2 超过 Opus4.8”就是一个鬼故事但是今天我不是来抨击 GLM5.2 的缺点我已经说过了。今天是来探讨一下优点或者进步点前端今天早上打开 X大模型竞技场的官方账号发布了这样一条消息这个内容的中文意思是激动人心的消息GLM-5.2 (Max) 在 Code Arena: Frontend 中排名第 2比 Claude Opus 4.7 (Thinking) 高出 29 分仅落后于 Fable 5GLM-5.2 是对 Kimi-K2.6 和 Minimax-M3 领先优势最大的最佳开源模型。React 子排行榜第 2 和 HTML 子排行榜第 4在几乎所有子类别中排名第一品牌与营销、基于参考的设计、数据与分析、消费品、游戏和模拟。一句话总结GLM5.2 前端已经超Opus4.8Thinking仅落后于Fable5大模型竞技场和单纯的基准数据不一样是有真人参与盲测的。虽然现在水分也很大每次国产模型发布都会刷一次榜但是比基准要靠谱一点。虽然我不相信这个排名但是它能排到第二也是能说明一些问题的。我们印象中GLM系列的前端是短板没想到现在都要成为优势项目了这其实是一个好消息对于真的在用 GLM5.2 的人来说这样 GLM5.2 就更加全面了花的钱更值了关于它前端能力增强的问题我其实在之前的两篇文章中都讲过虽然我不知道为什么但是确实像是加了一个精美 SKILL一般所有网页设计好像都精致了很多在布局方面要超 GPT5.5主要是它前端太拉了。所以这篇文章重点来讲一下前端的问题各位不要小看前端前端最复杂的是它和终端用户直接接触和人接触的东西其实都是很复杂的。今天正好借机给大家看一下 GLM5.2 相比 GLM5 老版本的差别。另外也可以拿 Opus4.8 来做一个对比。今天不喷人啊前几天测试太累了就安安静静地给大家做个对比。可以让大家在选择模型的时候做到“心中有数”我就挑几个比较有代表性的例子。先上一个视频然后慢慢讲1、赛博朋克版清明上河图我们先来看这个项目这个项目体现的特别明显这个题目的命题比较特殊各家大模型公司应该没有进行过针对性训练。所以非常有代表性泛化、审美、布局逻辑牛逼的模型才能做得好。很多模型完全就是混日子下面直接看效果。Opus4.8效果GLM5.0的效果GLM5.2的效果这个对是不是非常明显GLM5.0 的时候完全不成样子。但是 GLM5.2 各种建筑和物体的形态都已经出来了我觉得已经做的不错了。可以进步的地方是它赛博味儿够了清明味没有。Opus4.8 房子的线条、灯笼、配色、文字清明味浓一些赛博和清明上河图的融合会更好一点。当然还有一位选手更厉害古人的服装都出来了还有上善门汴河水水位播报虹桥反重力枢纽上面的两种飞行器下面是船和倒影后面远景图都做出来了意境拉满好了好了不说它了它不是主角主角是GLM5.2我们可以看到相比之前的版本是巨大的提升在众多国产模型中也是处于出类拔萃的程度。因为其他国产模型基本上就是GLM5.0的效果。2、无限流终端无限流终端需要构思一个冒险故事然后可以通过玩家的选择推进故事可以一直玩下去然后还要考虑到蝴蝶效应。你的选择会在后面体现因果。这个例子本身是考脑子的没想到 GLM5.2 视觉效果超乎寻常地优秀所以我也拿来说一下Opus4.8的效果GLM5.0的效果GLM5.2 的效果这一趴 Opus4.8 我不评论了你们可以去玩一下看看它的逻辑能力。我们主要是看一下GLM5 和 5.2 的差别。GLM5 处于布局崩塌的状态内容出框了。GLM 5.2 布局正常了动画效果超级酷炫在视频中应该能感受到当然它这个配色和深浅关系也是处理的恰到好处这个题目我还专门开发过一个桌面软件当时用的模型是 GLM5.1故事还可以。现在感觉可以把视觉效果和模型升级一下3、华丽的五子棋对战这个题目算法和 UI 双重考验五子棋的项目已经出现在 ZCode 官方演示中了所以应该有优化。我们直接看结果。Opus4.8的效果如下GLM5.0的效果如下GLM5.2的效果如下Opus4.8有点过于完美我不说了。无论是智商还是审美还是主题贴合度都非常不错了。GLM5.0 设计感是很差的蓝色背景完全不符合主题。GLM5.2 棋盘背景配色都有了优化。当然这个主题其实最好不要配这个底色还能优化一下。金色的配色帮它拉回来了一些。但是这个例子有 Bug……哈哈哈上篇文章分析过了。4、霓虹奔跑者这个例子其实有点冒险岛的感觉就是不停地往前推进支持二级跳然后地图要做 3 层视差最后死了要能炸开。Opus4.8的效果如下GLM5.0的效果如下GLM5.2的效果如下这一波 GLM5.2 还是比较优秀的。长出腿了而且有一点点炸开的效果了。重点是它这个画面纵深感做得非常好这是一种空间能力的体现。5、3D太阳系这个例子本来是考验 3D 效果的。就是用一个 HTML 文件实现一个交互式 3D 太阳系模型。GLM5.2 虽然 3D 效果不足但是可以发现抽象艺术玩得还可以。下面是 Opus4.8 的效果GLM5.0的效果GLM5.2的效果Opus4.8 是纹理拉满了所有选手中最强写实感最强。而 GLM5.2 这一波玩了一个抽象它只是用简单的线条来构建这个 3D 太阳系不够写实但是它线条处理还可以就是有一些设计感我用 ZCode 生成的所有例子都充满了“设计感”所以基本上可以确定 GLM5.2 在前端方面是有专门练过的。目前看有点过分精美设计感过强可能会出现什么作品都是这个味儿的感觉。但是比之前的版本确实好多了没有那么粗糙了。从上面的一些例子也可以看出来有些场景下确实视觉效果和交互效果都很赞能局部打赢 Opus4.8这是一个好消息。当然论全面能力实话实说差距还不小。在处理时间、思考深度、首次准确率方面还有待提升智谱的路是对的它一直在向 Claude 看齐专注于提升模型自身的能力而且对 Claude 兼容性也很高。Opus 用不上的情况GLM5.2 也是一个不错的选择。要比顶尖的部分它还不行。但是回归到现实场景对国内用户尤其是开发者来说还是首选。所有的例子都已经上传到JarvisUni的topai页面这次我还做了一个小升级以后除了模型之外还会备注一下生成这个网页的“智能体” 工具现在的比拼已经不单单是一个模型了而是全方位的比拼大家都开始做工程上的优化都推出了自己Harness所以要备注一下工具和模型这样会更加全面一些网址顶级AI | JarvisUni网页效果要在网页上才能看得出来

新闻详情

相关阅读

ASP.NET ViewState安全剖析：从__VIEWSTATE参数未加密看敏感信息泄露风险

用PowerShell精准掌控Windows 11网络适配器：从优先级调整到高级属性管理

Forza Mods AIO：地平线4和5的终极游戏增强工具全解析

TongWeb7安全加固：防御HOST头攻击与域名劫持实战指南

从零到一：CCS开发环境与C2000实战指南

跟着团子学SAP PS—项目成本核算的实战路径：从F-02手工记账到CJ88/KKA2结算

maptail与其他监控工具的对比分析：如何选择最佳实时GeoIP可视化方案

2026年重卡行业国家6月12日刚发布的政策！ - 慧知重卡充电桩管理平台

Nucleotide Transformer模型家族全解析：NT、AgroNT、SegmentNT等10大模型对比

2026最全面的AI大模型学习路线，适合零基础、大学习、想转行的

Awesome-Dify-Workflow：低代码AI编排的革命性突破

赛马娘DMM版中文汉化与性能优化全攻略：告别日文界面与卡顿烦恼