我做了全球首个会「自进化」「自微调」的 Code Agent :momo Code(V1.0.0)[特殊字符]

📅 2026/6/28 12:58:42
我做了全球首个会「自进化」「自微调」的 Code Agent :momo Code(V1.0.0)[特殊字符]
我做了全球首个会「自进化」「自微调」的 Code Agent momo CodeV1.0.0我做了全球首个 完全开源免费、会「自进化」「自微调」的 Code Agent我把它命名为 MOMO CODE 。 MOMO 代表了 每一个身处 AI 时代心怀热爱、坚持微光想要躬身创造价值的普通人。官网https://momozi.cc开源地址https://github.com/momozi1996/momo-codeMOMO CODE不只是代码Agent它会「自进化」 「自微调」它会自己变强。一、为什么 Code Agent 需要进化过去半年我高频使用了市面上许多 Code Agent 工具产品——Claude Code、Codex、Hermes Agent、Kimi code、Cursor……它们都很强尤其是CC 和 Codex 但有一个共同的问题模型是静态的。你教它一次它记住了你纠正它十次它可能还会犯第十一次。就像一个从不记笔记的学生。每次对话都是从零开始昨天的经验今天全忘。 我一直在想如果 Code Agent 能像人一样——从每次交互中学习、积累经验、持续进化——会怎样更进一步每次的交互、每一轮对话如果能吸纳为模型自我微调的养料——又会怎样于是我做了 MOMO CODE, 会「自进化」 「自微调」。二、MOMO CODE 是什么一句话MOMO CODE 是一个完全开源的、会自进化、会自微调的 AI 编程Agent 产品。 MOMO CODE V1.0.0版本它基于Opencode框架而衍生创新增加了 【自进化】 /evolve 和 【自微调】/fine-tune 模块支持 25 大模型DeepSeek、智谱 GLM、Moonshot Kimi、豆包、MiniMax、Claude、GPT-4、Gemini、……。支持自定义 OpenAI协议类 API接入任意模型。核心差异每次会话后自动积累经验通过 /evolve 快环和 /fine-tune 慢环持续自我进化。开源地址https://github.com/momozi1996/momo-code官网https://momozi.cc三、【自进化自微调】双速进化让它真正越用越聪明这是 MOMO CODE 最核心的设计。我叫它 “Two-Speed Evolution”——双速进化。灵感来自生物学细菌有快速适应应激反应和长期进化自然选择两个时间尺度并行。我也给 MOMO CODE 设计了两条进化回路01 快环 /evolve —— 【自进化】秒级经验积累每次你完成一个任务MOMO CODE 会观察整个过程中的信号测试通过了✅ 记一笔编辑被你接受了✅ 记一笔编译报错了❌ 记一笔你手动纠正了它❌ 记一笔当同一个模式出现 3 次以上比如bash 命令成功了系统会自动 提炼出一条经验策略tactic。下次你做类似任务时这些策略会通过 Thompson 采样一种贝叶斯方法兼顾用已知最好的方法和给新方法尝试机会自动注入到系统提示里。打个比方就像新手医生第一次做某种手术失败了第三次成功了前辈就会提醒下次注意这个步骤。MOMO CODE 的 /evolve 就是这个前辈而且不需要人工干预。02 慢环 /fine-tune ——【自微调】 周期性能力跃迁快环解决的是经验记忆。慢环解决的是能力升级。当积累的经验足够多时/fine-tune 会触发一个 完整的训练管线课程合成Curriculum→ 基线评估Baseline→ 训练Train→ 候选评估Candidate→ 棘轮门控Ratchet Gate→ 晋升Promote每一步都有严格的数学保证-课程合成默认驱动器是 Priors贝叶斯先验更新纯 CPU、秒级完成、不依赖任何外部系统。如果你需要真正的 LoRA 微调也可以接入 PEFT/Transformers。四、算法架构Bayesian Thompson Ratchet进化算法基于三个核心数学工具Beta(α, β) 贝叶斯追踪每条策略维护一个 Beta 分布。α 1 winsβ 1 losses。胜率 α / (α β)。这不是静态计数——每次有新数据整个后验概率分布都会更新。Thompson 采样选择策略时从每条策略的 Beta 分布中随机采样一个值按采样值排序选取前 6 条注入。这样做的好处是高胜率策略通常会被选中但新策略数据少、方差大也有机会被抽中尝试。自然平衡了利用和探索。Ratchet Gate棘轮门控PASS iff candidate.passAt1 baseline.passAt1 - 0.02 AND #regressions 0即新模型必须至少和旧模型一样好允许 2pp 噪声且不能有任何倒退。这个名字来源于机械棘轮——只能单向转动。五、系统架构四层 25 模型MOMO CODE 采用四层架构四层架构六、一个完整的进化 Demo你可以 5 分钟跑完整个进化流程终端里实际运行效果1安装2 快环 /evolve —— 【自进化】秒级经验积累% momo /evolve 相关3 慢环 /fine-tune ——【自微调】 周期性能力跃迁% momo /fine-tune七、为什么是首个实际上MOMO CODE 不是世界上第一个 Code Agent。但它是首个将经验快环KEP 训练慢环MCGS作为核心架构内置的开源 Code Agent。其他工具的进化要么是手动 prompt engineering人力要么是端到端微调贵且慢。我做的是 两速并行 ——秒级的经验注入 周期性的能力跃迁且默认完全免费。写在最后如果你在用它遇到 bug 或有想法欢迎来 GitHub 开 Issue。我们一起把它做得更强。作者MOMOZI架构图、算法详解、完整文档见 GitHub 仓库