搞定 AI 编程工作台的后台分布式难题 📅 2026/6/29 3:35:07 做 AI 编程工作台这种产品后台架构有个很特别是地方每个用户会话说到底就是一个活着的、有状态的、能跟你耗上一两个小时的生命体。用户丢一句话进来系统得挑一个合适的 AI Provider——Claude Code、Codex、Gemini、Kimi、CodeBuddy 等等光数名字就得掰半天手指头——然后拉起子进程通过流式通道实时把执行结果推回去还得在 SignalR 上同步各种状态变更。这事要搁传统无状态 HTTP Redis 方案身上头疼的问题就来了多 Provider 管理碎了一地。每种 AI CLI 工具有自己的进程模型、自己的流式输出格式、自己的超时脾气十几套逻辑揉在一起代码很快就变成了——你懂的——意大利面条。也不是说不能吃只是吃得胃疼。超时不可控全看命。一个 AI 操作可能跑三分钟完事也可能跟你耗上两个小时。用全局统一超时配置那短操作被无故掐断的场景啧想想都替用户委屈。反过来长操作把线程池吃光也不是什么美好的画面。并发要精打细算毕竟 GPU 不是大风刮来的。同时跑太多 AI 操作机器资源直接拉满但太保守也不行花钱买的算力白白晾着这跟把空调开到 16 度然后盖棉被有什么区别。得按全局许可精确控住活跃会话数。状态管理复杂到怀疑人生。每个会话有自己的消息队列、阶段状态、绑定的执行器——这些是有状态的数据硬往无状态 HTTP 模型里塞就只能拿 Redis 当万能胶水粘。粘是粘上了然后你就会发现自己写了一座山的序列化/反序列化和分布式锁逻辑。写完之后对着屏幕发呆我到底在解决业务问题还是在跟基础设施搏斗这几个问题凑在一起与其说是技术挑战不如说是架构选型的灵魂拷问。关于 HagiCode这些东西不是凭空想出来的。本文分享的方案来自我们在 HagiCode 项目里的真刀真枪踩坑经验。HagiCode 是个面向 AI 协作编程的桌面工作台它的后台要在单进程里协调十几种 AI CLI 工具还得给前端提供低延迟的实时响应——说白了就是又要马儿跑又要马儿不吃草还要马儿边跑边唱歌。下面要讲的 Orleans 架构正是我们在开发 HagiCode 过程中实打实踩坑、实打实优化出来的东西。如果你觉得这套方案有点意思那说明我们的工程底子还不赖——那么 HagiCode 本身或许也值得你多看两眼。选型为什么是 Orleans面对前面的灵魂拷问我们认认真真看了三条路方案 A无状态 API Redis 状态管理。逻辑倒也简单——每个请求从 Redis 掏会话状态、执行操作、再写回去。水平扩展确实舒服但 Redis 状态结构会跟着业务一起膨胀膨胀到你不知道自己到底在维护一个缓存还是在维护一个隐式的数据库。状态一致性得靠锁流式通信得额外搭 WebSocket/SSE 路由层。说白了Redis 在这里就是个共享大字典真正需要的有状态抽象它给不了。方案 BActor 模型框架Dapr / Akka.NET。Dapr 的 Actor 能力本身够用但它要求部署 Sidecar——对本地桌面端产品来说杀鸡用牛刀都算抬举了简直是开坦克去买菜。Akka.NET 的 Actor 模型更偏向低延迟短任务动辄一两小时的长生命周期工作流你得自己操心持久化和恢复框架不给兜底。方案 CMicrosoft Orleans。看到 Orleans 的 Virtual Actor 模型的时候怎么说呢那种感觉就像——找了半天钥匙结果发现就在自己口袋里。有几个特性简直是为我们这种场景量身缝制的Activation/Deactivation 自动管理你不用操心 grain 什么时候生、什么时候死运行时帮你全包了。一个会话对应一个 grain会话在 grain 就在会话结束 grain 自动回收。这种不用管的感觉经历过手动生命周期管理的人才会懂。IAsyncEnumerableT原生流式支持从 CLI 进程输出到前端展示全程异步流式不需要中间缓冲队列。就这一个特性帮我们省掉了至少上千行手写胶水代码。[AlwaysInterleave]和[ResponseTimeout]细粒度的并发和超时控制按接口级配不是全局一刀切。终于不用在要么全短、要么全长之间做痛苦的选择了。内置持久化状态IPersistentStateT状态自动持久化不需要再额外搭分布式缓存。省心真的省心。评估下来Orleans 对 HagiCode 后台的核心需求几乎是对号入座能力Orleans 对应方案有状态会话IPersistentStateT SQLite Shard 持久化流式输出IAsyncEnumerableT原生支持自动穿透到 SignalR长超时控制[ResponseTimeout(02:00:00)]按接口粒度配置Provider 多态路由ExecutorGrainFactory根据AIProviderType分发并发控制SessionConcurrencyManager配合 grain 单线程调度五个核心设计决策选好了工具只是第一步。怎么落地才是真正见功夫的地方。以下是我们踩过坑、爬起来、拍拍土之后沉淀下来的五个关键设计。有的是经验有的是教训有的......算了反正都写出来你自己看。1. Facade Grain 模式整个系统的核心调度 grain 是SessionGrain。但它不直接处理所有逻辑——真要那么干它会变成一个上万行的上帝类。上帝类这种东西写的时候觉得自己无所不能改的时候觉得自己一无是处。我们把特定领域逻辑委托给两个运行时组件ChatSessionGrain处理聊天模式ProposalSessionGrain处理提案模式。internal partial class SessionGrain(ILoggerSessionGrain logger,IServiceProvider serviceProvider,IExecutorGrainFactory executorGrainFactory,IMessageService messageService,[PersistentState(session)] IPersistentStateSessionState state): Grain, ISessionGrain{internal ChatSessionGrain ChatSessionComponent _chatSessionComponent ?? new ChatSessionGrain(RuntimeContext);internal ProposalSessionGrain ProposalSessionComponent _proposalSessionComponent ?? new ProposalSessionGrain(RuntimeContext);internal ISessionRuntimeComponent GetRuntimeComponent(SessionType sessionType) sessionType switch{SessionType.Chat ChatSessionComponent,SessionType.Proposal ProposalSessionComponent,_ throw new ArgumentOutOfRangeException(nameof(sessionType))};}这个模式的设计的干净利落grain 身份稳定不随 session 类型变来变去外部调用者只管和ISessionGrain打交道里面怎么分活它不操心组件本身无状态随时可以按需重建两者共享同一份SessionState持久化状态数据一致性天然搞定。谁说架构设计不能优雅来着2. 多态执行器工厂HagiCode 支持十几种 AI CLI 工具每种都要独立的进程管理和流式输出。我们为每种工具实现了一个专用 grain——ClaudeCodeGrain、CodexGrain、GeminiGrain等等名儿列出来跟点名似的。然后靠工厂统一路由internal sealed class ExecutorGrainFactory : IExecutorGrainFactory{public IExecutorStreamGrain GetExecutorGrain(AIProviderType executorType, CessionId cessionId){return executorType switch{AIProviderType.ClaudeCodeCli ExecutorStreamGrainAdapter.From(_grainFactory.GetGrainIClaudeCodeGrain(cessionId.Value)),AIProviderType.CodexCli ExecutorStreamGrainAdapter.From(_grainFactory.GetGrainICodexGrain(cessionId.Value)),AIProviderType.GeminiCli ExecutorStreamGrainAdapter.From(_grainFactory.GetGrainIGeminiGrain(cessionId.Value)),// ... 10 providers_ throw new NotSupportedException($Unsupported executor type: {executorType})};}}所有执行器 grain 实现同一个IExecutorStreamGrain接口通过ExecutorStreamGrainAdapter做统一适配。上层代码完全不感知底下用的是哪个 Provider——加一个新工具新增一个 grain 类在工厂的 switch 里加一行完事。这种扩展点怎么说呢像是给未来的自己留了一扇门门后面也不用什么复杂的迷宫径直走进去就好。3. 流式通信管道Orleans 对IAsyncEnumerableT的原生支持让流式输出变得特别自然。以ClaudeCodeGrain为例public async IAsyncEnumerableClaudeCodeResponse ExecuteCommandStreamAsync(string command,string? heroId,[EnumeratorCancellation] CancellationToken token default){var (provider, configuration) await CreateProviderAsync(heroId, token);await foreach (var response in SendAsync(command, provider, context, token)){yield return response;}}整个管道是这样的CLI 进程 stdout → grain 流式 yield →ExecutorGrainFactory包装为SessionMessage→SessionGrain通过 SignalR 推到前端。每一步都是异步流式的没有中间缓冲没有同步阻塞。这也是 Orleans 相比传统方案最爽的一点——你不需要在 grain 内部维护一个ConcurrentQueue然后手动推yield return四个字搞定