GPT-5.6被一客一审,但Hermes这周把多模型混排做透了 | Hermes周报#11

📅 2026/6/30 17:57:30
GPT-5.6被一客一审,但Hermes这周把多模型混排做透了 | Hermes周报#11
这是「Hermes Agent 周报」第 11 期每周一更新。记录全球最活跃的开源 AI Agent 框架 Hermes Agent 的每周动态。觉得有用就收藏关注不错过每周更新 6 月 27 号OpenAI 发了 GPT-5.6。听起来是个大事对吧。但你猜怎么着——这模型你调不了。不是价格的问题。是美国政府要求一客一审首批只开放给大约 20 家可信合作伙伴。普通开发者连 API 都摸不到。巧的是同一天Hermes 仓库里一条 commit 刚刚合进去feat(moa): references see full tool state fire on every user/tool response。MoA——Mixture of Agents多模型混排——这周一口气吃了 20 个 commit成了本期最大主题。一个模型被锁死了怎么办换一个。如果同时跑多个模型交叉验证呢这就是 MoA 在干的事。 本周数据6 月 22 日 ~ 6 月 28 日指标数值总提交927贡献者148新功能113Bug修复480测试59构建/CI45文档39重构27性能优化5当前版本v2026.6.19热门模块排名desktop101、gateway71、agent44、telegram24、release22、moa20、cron20、ci19、cli17、windows16。这周没有新 release。但 927 个 commit、148 个人的投入量说明 v0.18.0 的地基正在疯狂浇筑。一句话总结MoA 从能用变成能看——参考模型的输出第一次以独立块渲染出来桌面端远程 gateway 打通启动性能拉了一波大的安全团队又堵了两个 P1。 重头戏MoA 大改多模型混排终于能看了20 个 commit 全砸在 moa 模块上。我挑三条核心改动说。参考模型输出可视化3b44a3c8b163cb24d4Teknium——这是这周最直观的变化。之前 MoA 是个黑盒你开了一堆参考模型它们在后台跑了最后吐一个聚合结果给你。中间每个模型说了什么你不知道。现在不一样了。每个参考模型的输出会以带标签的独立块labelled block渲染出来排列在聚合结果之前。CLI、TUI、Desktop 三个端全支持。你终于能看见 GPT、Claude、GLM 各自的分析过程再看到 MoA 怎么综合它们的。说白了从信任黑盒变成了可审计的多模型协作。参考模型现在能看到完整工具状态7c38249c7Teknium——这条改动更深层。之前参考模型拿到的上下文是裁剪过的看不到工具调用结果。现在它们能看到完整的 tool state而且在每次 user/tool response 时都会触发。这意味着参考模型的判断质量直接上了一个台阶——它们不再是凭空猜而是基于跟主 agent 同样的信息在做分析。/moa改成 one-shot预设切换走 model picker50f685521teknium1——之前/moa是个 toggle开了就一直开着。现在改成一次性触发你输入/moa跑一轮多模型混排完了就恢复。想换预设比如从编程模式切到分析模式直接在 model picker 里切。这个改动看似小但它让 MoA 的心智模型清晰了——它不是一种模式而是一次咨询。你遇到拿不准的问题拉一轮多模型看看各自怎么说拿完结论继续干活。你平时用 MoA 跑什么场景最多代码 review方案选型还是翻译校对评论区聊聊我想看看大家的实际用法。️ 远程 Gateway桌面端终于能操作远端仓库了fc86e3576c7542358f4e9439cc3Brooklyn Nicholson | PR #54385这条改动解决了一个实打实的痛点。你在一台 Mac 上跑桌面端但 Hermes 实际跑在一台远程 Linux 服务器上通过 gateway 连接。之前你想用桌面端的 git cockpit 看 commit 历史、review 代码、切 worktree——不行因为文件系统是远程的本地的 git 操作全废。这周改了。git cockpit 现在能感知远程 gateway文件系统和 git 操作都走远程路由。folder picker 也是远程感知的——你选的目录是远程机器上的路径不是你本地 Mac 上的。用大白话说你的桌面端终于能当远程服务器的遥控器用了。不再是能看到输出但碰不到文件的半残状态。这对在远程服务器上跑 Hermes 的人应该不少是个实打实的体验提升。 WhatsApp 原生媒体投递cd592c105Teknium | PR #53598send_message工具现在支持通过 Baileys bridge 向 WhatsApp 发送图片、语音和文件了。之前 WhatsApp 渠道只能发文本现在跟 Telegram、Teams、iMessage 看齐了。加上上一期的 iMessagePhoton和 Teams 原生附件Hermes 的消息渠道矩阵又补了一块。⚡ 启动性能这个值得单独说这周只有 5 个性能 commit但密度很高。优化Commit效果libyaml CSafeLoader 解析配置980622d0eYAML 解析从纯 Python 换成 C 实现启动快一截网关平台适配器懒加载95f2919f9不再启动时全量加载所有平台插件用到的才加载会话切换快表加载c4c590e4a多会话场景下切换不再卡顿延迟 resume 成默认3bf00e459会话恢复从阻塞式改成延迟式不再卡启动大输出渲染限流cbe5c5689/learn之类的大输出不再冻屏单独看每条都是小优化。叠在一起启动速度和日常流畅度会有体感级别的改善。尤其是网关平台适配器懒加载这条——如果你配了 Telegram、WhatsApp、iMessage、飞书一堆渠道之前每次启动都得全部初始化现在只加载你实际在用的。 安全两个 P1 一波 SSRF 加固这周安全修复不少有两个标了 P1Telegram 未授权用户拦截c648ecdcateknium1PR #54164——之前未授权用户的请求会走到 event 构造阶段才被拒。现在在更早的阶段就拦掉。这意味着恶意请求不会消耗资源做无用的消息解析。浏览器私有网络守卫扩展61210097asrojk34PR #54435——private-network guard 之前只覆盖部分浏览器工具现在browser_get_images也纳入了。防止 agent 通过图片请求探测内网。还有一个SSRF 守卫d65468e7fTekniumPR #54470堵了元宝渠道的 media download_url——之前这个 URL 没做内网地址校验理论上可以被 SSRF。安全这件事在 Hermes 里不是想起来补一下而是持续性的扫雷。几乎每周都有。 其他值得知道的修复Gateway 重启后会话保留86e64900b——之前 gateway 重启会丢 session 状态现在能跨重启保住了。如果你遇到过gateway 一重启 agent 就失忆这周应该好了Curator 不再归档 cron 引用的 skill4c2961c51——之前 curator 的自动清理逻辑会误删 cron 任务还在用的 skill现在有保护了。这是个容易踩的坑——你的定时任务突然报skill not found翻半天发现是被自动清理了Anthropic base_url 残留修复e7d4ade8c——之前切到非 Anthropic 模型后旧的 base_url 还在影响请求路由。现在所有路径都做了清理Windows 控制台闪窗大扫除ee22d853e等——Windows 上每次跑 git、pdftoppm、skills hub 探测都会弹一个黑窗然后消失。这周做了全面覆盖应该安静了 行业视角当最强模型被锁在笼子里这周三件事放一起看信息量很大。GPT-5.6 被政府一客一审。6 月 27 号发布但美国要求逐个审批试用权限。首批只有约 20 家合作伙伴能用普通开发者连排队入口都找不到。这已经不是第一次了——之前 Anthropic 的 Fable 5 和 Mythos 5 就被全球下架过。前沿模型正在从谁都能调变成谁能调由政府说了算。Linux Foundation 拉了 19 家公司搞 Akrites。Anthropic、OpenAI、Google、Microsoft、AWS 全在列。目的在 AI 驱动的攻击者之前协调修复关键开源软件漏洞。翻译一下AI 让漏洞挖掘速度暴涨开源社区需要一个联合防御机制不然就是一个人挖洞全世界打补丁。百度开源 Unlimited OCR。3B 参数、500M 激活、OmniDocBench v1.5 全球第一。作者是疑似从 DeepSeek 出走的 OCR 核心成员。一个比很多模型小一个数量级的模型在端到端 OCR 上拿了 SOTA。对 Hermes 用户来说这三件事指向同一个方向别把鸡蛋放在一个模型篮子里。GPT-5.6 你调不了Hermes 的 MoA 让你同时跑 GLM-5.2 Claude 开源模型。Anthropic 被下架了换一个 provider 配置就行。这周 MoA 的改动让多模型混排从概念验证变成了日常可用的生产力工具——你能看到每个模型的推理过程再决定信哪个。这才是开源 agent 框架的护城河不被任何单一模型的命运绑架。你觉得多模型混排在实际使用中靠谱吗会不会增加太多 API 开销评论区说说你的顾虑下一期我可以专门聊聊 MoA 的成本控制策略。 升级建议当前版本仍是v2026.6.19v0.17.0但本周 927 个 commit 全是 pre-v0.18.0 的在途开发。如果你想体验本周的 MoA 改动和性能优化可以拉 nightlyhermesupdate--channelnightly如果用稳定版当前 v0.17.0 也够用等 v0.18.0 正式发布再升也不迟。这周最值得亲自试的把 MoA 打开跑一轮/moa看看多模型参考输出渲染出来是什么效果。光看 changelog 感受不到那种三个模型同时给你分析的体感。本文由「小星AI」整理发布数据来源NousResearch/hermes-agent专栏持续更新中欢迎订阅 ✨