AI Berkshire:多Agent协作的价值投资框架,让AI成为你的专业投研团队 📅 2026/7/3 0:44:41 如果你问 ChatGPT 或 Claude “拼多多值不值得买”大概率会得到一篇“一方面增长强劲另一方面竞争激烈建议投资者谨慎决策”的平衡分析。这种回答看似全面实则毫无用处——它没有帮你做出任何决策只是把信息重新排列组合了一遍。这正是当前 AI 在专业领域应用的最大痛点它擅长信息整理却难以形成可执行的、有纪律的深度判断。而 GitHub 上 Star 数超过 8.1k 的开源项目AI Berkshire正是为了解决这个问题而生。它不是一个简单的提示词合集而是一个将巴菲特、芒格、段永平、李录四位价值投资大师的方法论系统化、结构化并通过多 AI Agent 协作实现的专业级投资研究框架。简单来说AI Berkshire 让你“一个人 Claude Code / Codex 一个投研团队”。它最核心的价值在于将 AI 从一个“信息复读机”变成了一个具备结构化思维、反偏见机制和金融计算严谨性的“分析师团队”。根据项目披露的实盘数据这套框架在 2024 和 2025 年分别取得了 69.29% 和 66.38% 的收益大幅跑赢同期全球主要指数。本文将为你完整拆解 AI Berkshire 的设计理念、核心功能、安装部署和实战应用。无论你是对 AI Agent 协作开发感兴趣的技术开发者还是希望借助 AI 提升个人投资研究效率的投资者这篇文章都将提供一个从零到一的清晰路径。你会发现真正的 AI 赋能不是让机器说更多正确的废话而是让它帮你建立一套可重复、可验证、能对抗人性弱点的决策系统。1. AI Berkshire 解决了什么问题从“信息整理”到“决策支持”在深入技术细节之前我们必须先理解 AI Berkshire 要解决的根本矛盾。直接问大语言模型投资问题通常有三大缺陷结论模糊无法决策AI 倾向于给出“平衡”的答案避免承担风险导致结论模棱两可。视角单一缺乏对抗单一提示词只能提供一个视角无法模拟真实决策中不同思维模式的碰撞与挑战。数据幻觉与计算错误LLM 不擅长精确计算在市值、PE 等关键财务数据上容易出错且会“自信地”编造不存在的数据。AI Berkshire 的解决方案是构建一个“多 Agent 对抗性分析”系统。它不是一个超级智能体而是四个各司其职、互相挑战的“分析师”段永平视角 (商业模式)追问“这是不是一门好生意生意的本质是什么”巴菲特视角 (护城河与财务)分析竞争优势、财务健康度和安全边际。芒格视角 (逆向思考与风险)专门思考“这家公司会在什么情况下失败”李录视角 (文明趋势与长期确定性)判断公司是否顺应长期历史潮流10年后是否还能存在。这四个 Agent 会并行工作独立搜索信息、交叉验证数据、并给出各自独立的评分和结论。最终由一个“Team Lead”角色来综合研判形成一份带有明确“通过/不通过/灰色地带”结论以及具体价格区间和仓位建议的报告。这种设计带来的质变是你得到的不是一份 AI 生成的“研报”而是一个经过结构化流程和多视角对抗后产生的投资决策备忘录。它强制 AI 给出明确观点并为这个观点提供来自四个不同维度的证据链支撑。2. 核心架构与设计理念AI Berkshire 的整体架构清晰分为三层体现了其工程化的设计思想。2.1 三层架构解析Skill 层 (用户接口) 这是用户直接交互的入口。AI Berkshire 将复杂的投研工作流抽象成了 18 个明确的Skill在 Claude Code 中表现为/commands在 Codex 中表现为skills。用户无需记忆复杂流程只需调用对应的 Skill 并输入目标如公司名、行业名即可启动相应分析。 这些 Skill 分为五大类深度研究、财报分析、行业筛选、持仓管理、思维工具覆盖了从选股、分析到跟踪、归因的全流程。Agent 层 (核心引擎) 这是框架的“大脑”。每个 Skill 在执行时内部会启动多个独立的 AI Agent 进行并行研究。以核心的/investment-team为例它会同时启动上述四个大师视角的 Agent。每个 Agent 都拥有独立的上下文、搜索权限和思考过程它们会像真实的投研团队一样从不同角度切入问题甚至互相辩论。这种“多 Agent 协作”模式极大地扩展了单次分析的信息广度和思维深度。工具层 (质量保障) 这是框架的“双手”确保分析的严谨性。核心是一个名为financial_rigor.py的 Python 工具集它解决了 LLM 在金融场景下的两大顽疾计算精度所有财务计算使用 Python 的decimal.Decimal进行精确十进制运算彻底避免浮点数误差。数据验证提供市值验算、多源数据交叉验证误差超 1% 即告警、Benford 定律检测用于发现财务造假迹象等功能。2.2 核心设计哲学对抗与制衡AI Berkshire 的精髓不在于“融合”四位大师的观点而在于刻意制造“对抗”。这种对抗是避免认知偏误的关键。当段永平商业模式给出高分时芒格逆向思考会立刻追问“什么情况下这个商业模式会崩溃竞争对手最快需要多久能复制”当巴菲特财务估值认为极度便宜时李录长期确定性会审视“10年后这个行业还存在吗公司的管理层文化能保证它穿越周期吗”这种设计迫使分析必须触及问题的本质和反面而不是流于表面的罗列。它模拟了顶级投资机构内部“投委会”的辩论过程将 AI 从“助理”提升到了“合伙人”的层面。3. 环境准备与快速安装AI Berkshire 同时支持 Anthropic 的Claude Code和 OpenAI 的Codex两款 AI 编程助手客户端。你需要先安装其中一款。3.1 安装 AI 客户端对于 Claude Code 用户npm install -g anthropic-ai/claude-code安装后在终端输入claude即可启动。对于 Codex 用户# macOS / Linux curl -fsSL https://chatgpt.com/codex/install.sh | sh # 或使用 npm npm install -g openai/codex # 或使用 Homebrew (macOS) brew install --cask codex # 验证安装 codex --versionWindows 用户可以使用 PowerShell 安装powershell -ExecutionPolicy ByPass -c irm https://chatgpt.com/codex/install.ps1 | iex3.2 安装 AI Berkshire Skills克隆项目仓库git clone https://github.com/xbtlin/ai-berkshire.git cd ai-berkshire根据你的客户端安装 SkillsClaude Code 用户运行安装脚本将 Skills 复制到 Claude Code 的全局 commands 目录。./scripts/install-claude-commands.shCodex 用户运行安装脚本生成并安装 Skills 到 Codex 的本地技能目录。./scripts/install-codex-skills.sh可选如果你希望获得类似 Claude Code 中/command的快捷输入体验可以额外安装 slash prompts./scripts/install-codex-prompts.sh权限处理Claude Code 用户注意由于 Skills 会频繁调用网络搜索、文件读写等工具Claude Code 默认会为每个工具调用弹出授权确认。如果你在可信环境中使用可以启动跳过权限确认模式以提升体验claude --dangerously-skip-permissions请注意此模式会关闭安全确认仅建议在你完全信任当前工作目录和命令时使用。安装完成后重启你的 Claude Code 或 Codex 客户端Skills 即可生效。4. 核心 Skill 实战详解AI Berkshire 提供了 18 个 Skill这里重点剖析几个最具代表性的并通过示例展示其强大之处。4.1/investment-research单公司深度研究这是最全面的分析入口会对一家公司执行从数据收集到最终决策的七步完整流程。使用示例在 Claude Code 聊天框中直接输入/investment-research 腾讯控股或在 Codex 中描述任务使用 investment-research 研究腾讯控股输出核心结构化报告报告严格按“生意本质 - 护城河 - 逆向风险 - 管理层 - 文明趋势 - 估值”的结构输出确保每次分析维度一致。信息置信度评级对每个数据点标注 A/B/C 级置信度提醒你哪些判断是基于充足信息哪些存在推测。强制结论报告末尾会给出明确的综合评分如 4.7/5和投资建议通过/有条件通过/灰色地带并附上针对不同风险偏好投资者激进、稳健、保守的具体操作建议和价格区间。大师原话模拟会以“段永平说...”、“芒格追问...”的形式将大师的思维模式融入分析而不仅仅是贴标签。4.2/investment-team多 Agent 并行投研这是框架能力的集中体现。它同时启动 4 个 Agent并行完成对同一家公司的研究。使用示例/investment-team 美团工作流程与输出并行研究四个 Agent商业模式、财务估值、行业竞争、风险与管理层同时开始工作各自进行网络搜索、数据抓取和分析。独立结论每个 Agent 会生成自己视角下的独立报告和评分。综合研判Team Lead 汇总四份报告处理冲突点形成最终的统一结论和投资建议表。其价值在于你相当于在几分钟内召集了四个背景各异的分析师开了个投研会并且他们每个人都做了充分的功课。这比单个 AI 顺序思考的深度和广度有指数级提升。4.3/investment-checklist快速筛查过滤器当你面对大量公司无从下手时这个 Skill 能在 10 分钟内用巴菲特的六条标准进行快速过滤。使用示例支持多公司对比/investment-checklist 茅台, 英伟达, 苹果, 特斯拉六关筛选流程能力圈我能理解这家公司吗好生意它的经济特征优秀吗高ROIC低资本需求护城河它的竞争优势可持续吗管理层管理者值得信任且能干吗安全边际价格相对于内在价值足够便宜吗决策纪律我的买入决定是理性的还是出于 FOMO错失恐惧最终它会输出一个清晰的对比表格并附上“镜子测试”——要求你用不超过 5 句话清晰陈述买入理由。如果说不清则自动否决。4.4/news-pulse股价异动快速归因这是用于持仓管理的利器。当持仓股票突然大涨或大跌时它能帮你快速10-15分钟厘清原因避免情绪化操作。使用示例/news-pulse 腾讯 /news-pulse 拼多多 跌12% 一周内核心功能四维侦察同时从公司事件、监管政策、行业对手、市场情绪卖方报告、大V观点、资金流向四个维度搜集信息。归因排序不是罗列新闻而是判断哪个事件最可能“配得上”此次股价波动的幅度。性质判断明确区分是“价值事件”基本面变化、 “情绪波动”、“真因不明”还是“混合型”。行动建议直接给出“触发深度研究”、“重审投资逻辑”或“仅需观察”的操作建议。5. 金融严谨性工具告别 LLM 的“数学幻觉”LLM 在数学计算上的不可靠性是金融应用的一大障碍。AI Berkshire 通过本地 Python 工具链彻底解决了这个问题。项目中的tools/financial_rigor.py提供了以下关键命令# 1. 市值验算防止港币/人民币等单位混淆导致的重大错误 python3 tools/financial_rigor.py verify-market-cap \ --price 510 \ # 股价 --shares 9.11e9 \ # 总股本 --reported 4.65e12 \ # 报告中的市值 --currency HKD # 货币单位 # 输出✅ 验证通过偏差 0.08% # 2. 多源交叉验证确保关键数据可靠 python3 tools/financial_rigor.py cross-validate \ --metric PE_Ratio \ --sources 15.3 16.1 14.8 \ # 从不同来源获取的PE值 --tolerance 0.05 # 容忍5%的偏差 # 如果某个源数据偏离过大会发出警告。 # 3. 三情景估值计算乐观、中性、悲观假设下的估值区间 python3 tools/financial_rigor.py three-scenario \ --base-fcf 100 \ # 基准自由现金流单位亿 --growth-rates 0.15 0.10 0.05 \ # 乐观/中性/悲观增长率 --wacc 0.08 \ # 加权平均资本成本 --terminal-growth 0.02 # 永续增长率 # 输出三个情景下的内在价值区间。 # 4. Benford定律检测初步筛查财务数据异常 python3 tools/financial_rigor.py benford \ --data-file revenue_digits.csv # 收入数字列表 # 分析首位数字分布是否符合自然规律异常可能提示财务问题。这些工具被深度集成到各个 Skill 中。当 Agent 需要计算 PE、市值或进行 DCF 估值时会自动调用这些本地工具执行精确计算并将结果返回给 LLM 进行推理。这保证了分析报告的数学基础是坚实无误的。6. 实战案例如何用 AI Berkshire 分析一家公司让我们以分析“美团”为例串联起核心技能的使用。第一步快速初筛当你对美团感兴趣时首先用 Checklist 进行快速过滤。/investment-checklist 美团这个过程大约2-3分钟它会告诉你美团是否值得你花更多时间深入研究。如果输出显示在“能力圈”、“好生意”等关键关卡通过则进入下一步。第二步深度并行研究启动多 Agent 团队进行全方位剖析。/investment-team 美团等待5-10分钟你会得到一份包含四维度评分、综合结论和具体操作建议的报告。报告可能会指出美团在本地生活的网络效应护城河段永平视角很强当前估值巴菲特视角处于历史低位但需警惕抖音在到店业务的竞争芒格视角。第三步关键问题深挖如果报告中对管理层或某项新业务如美团优选存在疑虑可以使用特定技能深入。/management-deep-dive 王兴 美团这个 Skill 会聚焦于管理层的背景、历史决策、股权结构、薪酬体系等评估其是否值得信赖。第四步持仓管理与跟踪假设你基于报告决定买入后续可以使用持仓管理技能。定期复盘/portfolio-review 美团30% 腾讯40% 现金30%来审视整体组合的健康度。论文跟踪/thesis-tracker 美团来持续监控你当初买入的核心逻辑如“外卖业务利润率持续提升”是否被证实或证伪。异动归因某天美团股价大跌立即使用/news-pulse 美团快速判断是市场情绪、行业政策还是公司基本面出了问题避免盲目止损。这一套流程将一个非专业的个人投资者武装成了一个拥有标准化研究流程、交叉验证机制和持续跟踪纪律的迷你投资机构。7. 常见问题与排查思路在安装和使用 AI Berkshire 过程中你可能会遇到以下问题问题现象可能原因排查方式解决方案Claude Code 中无法识别/命令Skills 未正确安装或路径不对在 Claude Code 中尝试输入/查看命令列表1. 确认已运行install-claude-commands.sh。2. 检查 Claude Code 的全局 commands 目录权限。3. 重启 Claude Code 客户端。Codex 中调用 skill 无反应Skill 未安装或未加载在 Codex 聊天框输入使用 investment-research 研究腾讯看是否有对应动作1. 确认已运行install-codex-skills.sh。2. 重启 Codex 客户端。3. 检查~/.codex/skills目录下是否有对应技能文件夹。工具调用被频繁要求授权 (Claude Code)Claude Code 默认安全设置每次调用网络搜索、文件读取时都会弹出确认1. 接受授权。2. 或在可信环境下使用claude --dangerously-skip-permissions启动需谨慎。财务数据获取失败或错误网络问题或数据源不可用观察 Agent 执行日志看是哪一步数据抓取出错1. 检查网络连接。2. 项目依赖公开数据源某些国内公司数据可能受限可尝试使用公司股票代码如0700.HK或英文名。分析报告深度不够可能受限于 Claude/Codex 模型本身的上下文和理解能力对比不同模型版本如 Claude 3.5 Sonnet vs Haiku的输出1. 确保使用能力最强的模型版本。2. 在 Skill 调用时可以附加更详细的指令如/investment-research 腾讯 请重点分析视频号对广告业务的贡献。“镜子测试”无法通过对公司的理解确实不深入审视报告中的“能力圈”评分和阐述这可能是框架最有价值的反馈——它告诉你你其实并不真正理解这家公司。此时应放弃投资或回归第一步进行更基础的学习。8. 最佳实践与高级使用技巧要让 AI Berkshire 发挥最大效力不仅在于会用更在于用得巧。从 Checklist 开始用 Team 深入不要一上来就对陌生公司使用/investment-team耗时且可能浪费资源。先用/investment-checklist快速过滤掉明显不符合标准的公司对通过的标的再启动深度研究。善用“灰色地带”结论框架的结论除了“通过”和“不通过”还有“灰色地带”。这通常意味着数据不足或关键变量存在巨大不确定性如政策风险、技术路径未定。“灰色地带”不是失败而是最重要的风险提示它告诉你这里需要人类更高阶的判断或更长时间的观察。交叉使用不同 Skill 进行验证对于重点公司可以先后使用/investment-research系统化和/investment-team并行化进行分析对比两份报告的侧重点和结论是否一致。也可以用/earnings-review仔细研读最新财报验证深度报告中的财务假设。建立自己的研究档案将 AI Berkshire 生成的所有报告保存下来。半年或一年后对同一家公司再次运行分析使用/thesis-tracker对比新旧报告看哪些判断被验证哪些被证伪。这是提升你自身投资认知的最佳方式。理解框架的边界它不是预测工具AI Berkshire 分析的是公司的质地和价格的关系不预测短期股价走势。它依赖公开信息其分析质量受限于网络可获取的公开数据。对于内幕信息或未公开的细节它无能为力。它不能替代你的最终决策框架输出的是“决策支持”而不是“决策本身”。最后的买入、持有、卖出按钮必须由你亲手按下并对结果负全部责任。关注工具层更新定期关注项目 GitHub 仓库的更新尤其是tools/目录下的金融工具。作者可能会增加新的数据源接入如通过 MCP 协议接入 Bloomberg、Wind 等或更强大的分析工具。9. 总结从“玩票”到“专业”的桥梁AI Berkshire 的出现标志着一个转折点AI 在专业领域的应用正从“玩具”和“助手”迈向“协作伙伴”和“流程引擎”。它提供的不是又一个聊天界面而是一套可重复、可验证、具备内在制衡机制的决策系统。对于开发者而言这是一个绝佳的多 Agent 协作系统的实战案例展示了如何将复杂的领域知识价值投资工程化为一系列可执行的 AI 技能和严谨的工具链。对于投资者而言这可能是第一次有机会以极低的成本拥有一个“7x24小时工作、不受情绪影响、融合大师智慧、计算绝对精准”的个人投研团队。它不能保证你赚钱——没有任何工具可以——但它能极大地提高你投资决策过程的理性程度和纪律性。最终AI Berkshire 的价值不在于给出一个“必涨代码”而在于它强制你遵循一个优秀的决策流程。在这个流程中AI 负责提供广度、深度和计算而你负责提供最终的判断、勇气和承担责任的肩膀。这或许是人机协作在投资领域最理想的形态。下一步你可以按照第 3 节的步骤在你的 Claude Code 或 Codex 中安装并尝试第一个 Skill。从一个你非常熟悉的公司比如你所在行业的公司开始分析感受框架的分析逻辑与你自己认知的异同。查阅项目docs/目录下的实战报告理解一份高质量输出应该长什么样。思考如何将这套框架的“多 Agent 对抗”和“工具链严谨性”思想迁移到你自己的专业领域中去。