Higress v2.2.3 发布:AI Gateway 能力增强,Gateway API 及其推理扩展持续打磨

📅 2026/6/30 3:09:44
Higress v2.2.3 发布:AI Gateway 能力增强,Gateway API 及其推理扩展持续打磨
作者如漫Higress 近期发布了 v2.2.3 版本主仓库共 48 项更新、Higress Console 8 项更新。核心变化包括AI Gateway新增 vLLM 协议透传与ai-context-limit上下文限制插件增强 AI 安全防护与负载均衡并修复一批多厂商协议兼容问题。Gateway API 与推理扩展支持可配置的 GatewayClass 隔离、默认分离稳定与实验性资源并修复推理路由在 HTTPRoute 合并时的配置丢失问题。Ingress 迁移支持跳过 IngressClass 创建、正确保留 LoadBalancer hostname尽量不改动集群中已有的资源。安全与稳定性jwt-auth支持 remote JWKS并加固 OIDC、TLS 校验、限流与 WASM/MCP 运行时。ConsoleLLM provider token 列表支持折叠并修复多项 MCP 与路由配置问题。此外社区层面 Higress 已正式完成 CNCF Sandbox 入驻。下面按主题展开。AI Gateway自建模型、长上下文与安全拦截过去几个版本里Higress 的 AI Gateway 能力一直围绕一个方向演进让不同模型服务尽量通过统一入口接入同时少让业务应用自己处理协议差异。v2.2.3 继续在这条线上做了增补并修掉了一批协议兼容上的小毛病。新增与增强AI Proxy 支持 vLLM 透传 Anthropic Messages 和新版 OpenAI endpoints#3989。能原样透传的请求不再做多余转换链路更短排查也更轻。新增ai-context-limitWASM 插件#4000可以在网关层提前判断请求是否超过模型上下文限制省去等请求打到模型服务才失败的浪费。长文档问答、RAG、多轮对话、代码分析这类场景会比较实用。ai-security-guard增加结构化拒绝响应、错误路径指标和 AI 日志#3894并支持 Embedding API 内容检测#3895。安全插件在拦截之后还能把原因说清楚方便业务侧展示提示、做审计、接告警。ai-load-balancer新增基于一致性哈希的cluster_hash策略#3898model-router支持保留完整原始模型名#3916。问题修复Vertex 场景补齐 tool call ID、保留thoughtSignature、完善 Claude stream delta 中的 tool call type#3973、#3985、#3990。Claude API 名称识别从宽泛匹配改成更准确的后缀判断#3839减少同一套客户端换个模型就出现异常 400 的概率。修复ai-cache在 SSE 流式响应首个 chunk 只有 role 时的兼容问题#3962修复 #3953。Gateway API多网关隔离与版本兼容Gateway API 正在成为 Kubernetes 入口流量管理的重要标准。它比传统 Ingress 拆得更细GatewayClass 负责说明谁来管网关Gateway 负责网关实例HTTPRoute 等资源负责路由规则。拆得更清楚之后多团队、多网关、多协议的边界也更容易表达但标准持续演进生产环境里也会随之冒出一些现实问题。新增与增强支持可配置的 GatewayClass 隔离#3981。过去 Higress 默认监听固定的 GatewayClass对单套网关很直接当一个集群里同时有公网、内网、测试等多套网关时就需要更明确地分清谁处理哪些资源。现在多套 Higress 可以在同一集群里各自管理对应的资源。默认关闭 alpha Gateway API watch#3971把稳定资源和实验性资源分开常规能力默认启用实验性能力按需开启减少版本差异对控制器启动和同步的影响。问题修复修复 Gateway 状态地址写入#3980。对依赖 Gateway 状态做自动化发布、DNS 更新或平台展示的团队来说状态写准确很重要。Gateway API 推理扩展让 AI 推理流量获得更合理的调度普通 Web 服务做负载均衡常见依据是权重、连接数、健康状态。AI 推理流量会更复杂一些不同请求可能命中不同模型不同副本的 GPU 负载不同队列长度不同缓存命中情况也不同。Gateway API Inference Extension 想解决的就是这类问题让网关在转发 AI 推理请求时可以结合推理后端的状态做更合适的调度。本次版本修复了 InferencePool 路由配置在 HTTPRoute 合并时可能丢失的问题#3964。当多个推理路由挂在同一个网关和域名下时Higress 需要正确保留每条路由对应的推理调度配置不能在合并过程中退回普通负载均衡。这项能力还在跟随 Gateway API Inference Extension 持续演进但它代表了 AI Gateway 的一个重要方向网关不再只是入口也会逐步参与推理流量调度。Ingress 迁移尽量减少对既有集群资源的改动Gateway API 是未来方向但 Ingress 仍然是大量线上系统的现实入口。尤其是 Ingress NGINX很多团队已经用了很多年配置、发布系统、告警、DNS 自动化都围着它跑。所以从 Ingress NGINX 迁移到 Higress 时用户最关心的往往不是新网关能不能写一套全新配置而是已有配置能不能少改一点、现有平台边界能不能不被打乱。继 v2.2.2 的nginx-rewrite-compatible插件之后v2.2.3 继续在迁移和安装细节上做补强。新增与增强Helm 支持跳过 IngressClass 创建#3979。很多集群里的 IngressClass 是预先创建和统一管理的安装网关时不应擅自覆盖或新建。现在可以让 Higress 监听指定对象而不动平台已有资源。问题修复正确保留 Ingress LoadBalancer hostname#3994。有些云厂商返回的是域名而非 IP状态同步时若丢了 hostname外部系统、DNS 自动化和迁移验证都会受影响。imagePullPolicy从 PodSpec 调整到容器级别#3924并补齐 controller 和 promtail sidecar 的镜像拉取策略#4002plugin-server 镜像 tag 默认跟随 Chart 版本#3998。这些都算不上亮眼的功能但迁移真正落地时往往正是这些小地方决定了你要不要回滚。安全与稳定性网关在入口位置安全默认值不能含糊。这一节大多是修复和加固但每一项都直接关系到线上的可靠性。新增与增强jwt-auth支持 remote JWKS#3838便于把认证公钥集中管理后续密钥轮转也更方便。Key Auth 支持同一个服务配置多个凭证#3849对迁移和多客户端接入更友好。问题修复与加固OIDC升级oauth2-proxy修复 verifier callback 中的 nil panic#3914修复 Session 刷新时Set-Cookie被损坏的问题#3928并在 verifier 不可用时 fail closed#4013。最后一项尤其重要认证组件异常时受保护路由应该明确失败而不是悄悄放行。TLS回滚了跳过 HTTPS 上游证书校验的行为#4016恢复更谨慎的默认校验。限流插件增强了 cluster key rate limit cookie 解析的健壮性#4012。运行时MCP filter 在高内存使用时会重建#3922并移除了 WASM request-count rebuild 触发条件减少不必要的重建#3923。Console配置增多后的操作体验优化Higress Console v2.2.3 包含 8 项更新主要集中在 MCP、LLM provider 配置和路由操作体验。新增与增强LLM provider token 列表支持折叠higress-console#722。配置多个 token 做负载均衡或容灾时页面不用一直摊开一长串内容。问题修复MCP服务名称包含冒号时可以正确解析higress-console#724删除 MCP server 时不会误删同名 routehigress-console#735SSE transport 的 direct routing path 拼接也做了修正higress-console#734。其他修复服务权重表 stale statehigress-console#733、系统服务潜在 NPEhigress-console#729、YAML 尾随空白提交higress-console#730、deploy-to-OSS workflowhigress-console#737等问题。Console 这些改动的目标很直接减少配置出错让页面更易使用。CNCF Sandbox 入驻完成比起上面这些功能细节这个版本周期里更值得说的是 Higress 在社区治理上的一步经 CNCF TOC 投票通过后Higress 已经正式完成 CNCF Sandbox 入驻cncf/sandbox#481。入驻不是一句口号而是一份需要逐项落实的清单。围绕这份清单Higress 在这段时间里完成了几类工作知识产权与合规签署项目贡献协议Contribution Agreement将商标、Logo 等资产移交 Linux Foundation遵循 CNCF IP 政策采用 Apache 2.0 许可证并接入许可证扫描以满足第三方依赖的合规要求。中立托管项目迁入独立、中立的 GitHub 组织并加入 CNCF 的 GitHub Enterprise 账号由基金会保障中立托管不再绑定在单一公司名下。治理与安全制度建立开放治理与安全策略文档在仓库中明确引用 CNCF 行为准则为所有仓库启用 DCO并持续推进 OpenSSF 最佳实践徽章。社区透明度维护者名单并入 CNCF 聚合列表项目接入 DevStats、CLOmonitor、LFX Insights 等社区健康度看板活跃度、贡献分布等数据公开可查。对正在选型或已经在用 Higress 的团队来说这些事不像功能那样直接可感但它们回答的是另一个更要紧的问题当你把生产流量交给一个开源网关它背后的项目是否在被认真、长期、透明地维护。完成 Sandbox 入驻意味着 Higress 的治理、合规与社区运作被纳入了 CNCF 的公共框架而不只是依赖某一家公司或某几个人。接下来Higress 也会朝 Incubation 阶段继续准备。目前在活跃贡献者、社区关注度和 PR 活跃度上已经有了不错的基础后续会把更多精力放在治理流程、安全治理以及贡献者和采用方来源的多元化上。如果你已经在生产或重要测试环境中使用 Higress欢迎提供采用案例如果你愿意参与 CNCF 采用方访谈也欢迎主动联系 Higress maintainer。谁应该升级如果你符合下面这些场景建议关注 v2.2.3正在使用 Higress 作为 AI Gateway特别是接入 vLLM、Vertex、Claude-compatible API、流式响应、AI 安全防护或上下文限制能力。正在使用 Gateway API或者关注 Gateway API Inference Extension 在 AI 推理调度中的落地。正在评估从 Ingress NGINX 迁移到 Higress希望尽量复用现有 IngressClass、LoadBalancer 状态和平台发布流程。对认证链路、OIDC、TLS 校验、限流 Cookie、WASM/MCP 运行稳定性比较敏感。正在使用 Higress Console 管理 LLM provider、MCP server 或路由权重。升级方式helm repo update helm upgrade higress higress.io/higress--version2.2.3如果你正在使用 Gateway API、Ingress 迁移相关配置、AI Gateway 插件或自定义 Helm 参数建议先在测试环境渲染并对比安装结果helm template higress higress.io/higress--version2.2.3higress-2.2.3.yaml贡献者本次发布共有 18 位贡献者参与其中 10 位是首次贡献首次贡献GHX5T-SOL · FAUST-BENCHOU · ponypony0123 · XinhhD · geekspeng · philo-x · yyyCode · zijiren233 · enkilee · Rand01ph持续贡献Betula-L · JianweiWang · zat366 · EndlessSeeker · Jing-ze · CH3CHO · johnlanni · JayLi52每一个 PR 背后都是真实的使用场景和真实的问题。感谢每一位让 Higress 继续向前的贡献者。相关链接Higress GitHubhttps://github.com/higress-group/higressHigress v2.2.3 Release Noteshttps://github.com/higress-group/higress/releases/tag/v2.2.3Higress Console v2.2.3https://github.com/higress-group/higress-console/releases/tag/v2.2.3Higress 完整变更https://github.com/higress-group/higress/compare/v2.2.2…v2.2.3Higress Console 完整变更https://github.com/higress-group/higress-console/compare/v2.2.2…v2.2.3Gateway API Inference Extensionhttps://gateway-api-inference-extension.sigs.k8s.io/