AI Berkshire:多Agent协作的价值投资框架,让AI成为你的专业投研团队
如果你问 ChatGPT 或 Claude “拼多多值不值得买”,大概率会得到一篇“一方面增长强劲,另一方面竞争激烈,建议投资者谨慎决策”的平衡分析。这种回答看似全面,实则毫无用处——它没有帮你做出任何决策,只是把信息重新排列组合了一遍。
这正是当前 AI 在专业领域应用的最大痛点:它擅长信息整理,却难以形成可执行的、有纪律的深度判断。而 GitHub 上 Star 数超过 8.1k 的开源项目AI Berkshire,正是为了解决这个问题而生。它不是一个简单的提示词合集,而是一个将巴菲特、芒格、段永平、李录四位价值投资大师的方法论系统化、结构化,并通过多 AI Agent 协作实现的专业级投资研究框架。
简单来说,AI Berkshire 让你“一个人 + Claude Code / Codex = 一个投研团队”。它最核心的价值在于,将 AI 从一个“信息复读机”变成了一个具备结构化思维、反偏见机制和金融计算严谨性的“分析师团队”。根据项目披露的实盘数据,这套框架在 2024 和 2025 年分别取得了 +69.29% 和 +66.38% 的收益,大幅跑赢同期全球主要指数。
本文将为你完整拆解 AI Berkshire 的设计理念、核心功能、安装部署和实战应用。无论你是对 AI Agent 协作开发感兴趣的技术开发者,还是希望借助 AI 提升个人投资研究效率的投资者,这篇文章都将提供一个从零到一的清晰路径。你会发现,真正的 AI 赋能,不是让机器说更多正确的废话,而是让它帮你建立一套可重复、可验证、能对抗人性弱点的决策系统。
1. AI Berkshire 解决了什么问题:从“信息整理”到“决策支持”
在深入技术细节之前,我们必须先理解 AI Berkshire 要解决的根本矛盾。直接问大语言模型投资问题,通常有三大缺陷:
- 结论模糊,无法决策:AI 倾向于给出“平衡”的答案,避免承担风险,导致结论模棱两可。
- 视角单一,缺乏对抗:单一提示词只能提供一个视角,无法模拟真实决策中不同思维模式的碰撞与挑战。
- 数据幻觉与计算错误:LLM 不擅长精确计算,在市值、PE 等关键财务数据上容易出错,且会“自信地”编造不存在的数据。
AI Berkshire 的解决方案是构建一个“多 Agent 对抗性分析”系统。它不是一个超级智能体,而是四个各司其职、互相挑战的“分析师”:
- 段永平视角 (商业模式):追问“这是不是一门好生意?生意的本质是什么?”
- 巴菲特视角 (护城河与财务):分析竞争优势、财务健康度和安全边际。
- 芒格视角 (逆向思考与风险):专门思考“这家公司会在什么情况下失败?”
- 李录视角 (文明趋势与长期确定性):判断公司是否顺应长期历史潮流,10年后是否还能存在。
这四个 Agent 会并行工作,独立搜索信息、交叉验证数据、并给出各自独立的评分和结论。最终,由一个“Team Lead”角色来综合研判,形成一份带有明确“通过/不通过/灰色地带”结论,以及具体价格区间和仓位建议的报告。
这种设计带来的质变是:你得到的不是一份 AI 生成的“研报”,而是一个经过结构化流程和多视角对抗后产生的投资决策备忘录。它强制 AI 给出明确观点,并为这个观点提供来自四个不同维度的证据链支撑。
2. 核心架构与设计理念
AI Berkshire 的整体架构清晰分为三层,体现了其工程化的设计思想。
2.1 三层架构解析
Skill 层 (用户接口): 这是用户直接交互的入口。AI Berkshire 将复杂的投研工作流抽象成了 18 个明确的
Skill(在 Claude Code 中表现为/commands,在 Codex 中表现为skills)。用户无需记忆复杂流程,只需调用对应的 Skill 并输入目标(如公司名、行业名),即可启动相应分析。 这些 Skill 分为五大类:深度研究、财报分析、行业筛选、持仓管理、思维工具,覆盖了从选股、分析到跟踪、归因的全流程。Agent 层 (核心引擎): 这是框架的“大脑”。每个 Skill 在执行时,内部会启动多个独立的 AI Agent 进行并行研究。以核心的
/investment-team为例,它会同时启动上述四个大师视角的 Agent。每个 Agent 都拥有独立的上下文、搜索权限和思考过程,它们会像真实的投研团队一样,从不同角度切入问题,甚至互相辩论。这种“多 Agent 协作”模式,极大地扩展了单次分析的信息广度和思维深度。工具层 (质量保障): 这是框架的“双手”,确保分析的严谨性。核心是一个名为
financial_rigor.py的 Python 工具集,它解决了 LLM 在金融场景下的两大顽疾:- 计算精度:所有财务计算使用 Python 的
decimal.Decimal进行精确十进制运算,彻底避免浮点数误差。 - 数据验证:提供市值验算、多源数据交叉验证(误差超 1% 即告警)、Benford 定律检测(用于发现财务造假迹象)等功能。
- 计算精度:所有财务计算使用 Python 的
2.2 核心设计哲学:对抗与制衡
AI Berkshire 的精髓不在于“融合”四位大师的观点,而在于刻意制造“对抗”。这种对抗是避免认知偏误的关键。
- 当段永平(商业模式)给出高分时,芒格(逆向思考)会立刻追问:“什么情况下这个商业模式会崩溃?竞争对手最快需要多久能复制?”
- 当巴菲特(财务估值)认为极度便宜时,李录(长期确定性)会审视:“10年后这个行业还存在吗?公司的管理层文化能保证它穿越周期吗?”
这种设计迫使分析必须触及问题的本质和反面,而不是流于表面的罗列。它模拟了顶级投资机构内部“投委会”的辩论过程,将 AI 从“助理”提升到了“合伙人”的层面。
3. 环境准备与快速安装
AI Berkshire 同时支持 Anthropic 的Claude Code和 OpenAI 的Codex两款 AI 编程助手客户端。你需要先安装其中一款。
3.1 安装 AI 客户端
对于 Claude Code 用户:
npm install -g @anthropic-ai/claude-code安装后,在终端输入claude即可启动。
对于 Codex 用户:
# macOS / Linux curl -fsSL https://chatgpt.com/codex/install.sh | sh # 或使用 npm npm install -g @openai/codex # 或使用 Homebrew (macOS) brew install --cask codex # 验证安装 codex --versionWindows 用户可以使用 PowerShell 安装:
powershell -ExecutionPolicy ByPass -c "irm https://chatgpt.com/codex/install.ps1 | iex"3.2 安装 AI Berkshire Skills
克隆项目仓库:
git clone https://github.com/xbtlin/ai-berkshire.git cd ai-berkshire根据你的客户端安装 Skills:
Claude Code 用户:运行安装脚本,将 Skills 复制到 Claude Code 的全局 commands 目录。
./scripts/install-claude-commands.shCodex 用户:运行安装脚本,生成并安装 Skills 到 Codex 的本地技能目录。
./scripts/install-codex-skills.sh(可选)如果你希望获得类似 Claude Code 中
/command的快捷输入体验,可以额外安装 slash prompts:./scripts/install-codex-prompts.sh权限处理(Claude Code 用户注意):由于 Skills 会频繁调用网络搜索、文件读写等工具,Claude Code 默认会为每个工具调用弹出授权确认。如果你在可信环境中使用,可以启动跳过权限确认模式以提升体验:
claude --dangerously-skip-permissions请注意:此模式会关闭安全确认,仅建议在你完全信任当前工作目录和命令时使用。
安装完成后,重启你的 Claude Code 或 Codex 客户端,Skills 即可生效。
4. 核心 Skill 实战详解
AI Berkshire 提供了 18 个 Skill,这里重点剖析几个最具代表性的,并通过示例展示其强大之处。
4.1/investment-research:单公司深度研究
这是最全面的分析入口,会对一家公司执行从数据收集到最终决策的七步完整流程。
使用示例:在 Claude Code 聊天框中直接输入:
/investment-research 腾讯控股或在 Codex 中描述任务:
使用 investment-research 研究腾讯控股输出核心:
- 结构化报告:报告严格按“生意本质 -> 护城河 -> 逆向风险 -> 管理层 -> 文明趋势 -> 估值”的结构输出,确保每次分析维度一致。
- 信息置信度评级:对每个数据点标注 A/B/C 级置信度,提醒你哪些判断是基于充足信息,哪些存在推测。
- 强制结论:报告末尾会给出明确的综合评分(如 4.7/5)和投资建议(通过/有条件通过/灰色地带),并附上针对不同风险偏好投资者(激进、稳健、保守)的具体操作建议和价格区间。
- 大师原话模拟:会以“段永平说:...”、“芒格追问:...”的形式,将大师的思维模式融入分析,而不仅仅是贴标签。
4.2/investment-team:多 Agent 并行投研
这是框架能力的集中体现。它同时启动 4 个 Agent,并行完成对同一家公司的研究。
使用示例:
/investment-team 美团工作流程与输出:
- 并行研究:四个 Agent(商业模式、财务估值、行业竞争、风险与管理层)同时开始工作,各自进行网络搜索、数据抓取和分析。
- 独立结论:每个 Agent 会生成自己视角下的独立报告和评分。
- 综合研判:Team Lead 汇总四份报告,处理冲突点,形成最终的统一结论和投资建议表。
其价值在于:你相当于在几分钟内,召集了四个背景各异的分析师开了个投研会,并且他们每个人都做了充分的功课。这比单个 AI 顺序思考的深度和广度有指数级提升。
4.3/investment-checklist:快速筛查过滤器
当你面对大量公司无从下手时,这个 Skill 能在 10 分钟内用巴菲特的六条标准进行快速过滤。
使用示例(支持多公司对比):
/investment-checklist 茅台, 英伟达, 苹果, 特斯拉六关筛选流程:
- 能力圈:我能理解这家公司吗?
- 好生意:它的经济特征优秀吗?(高ROIC,低资本需求)
- 护城河:它的竞争优势可持续吗?
- 管理层:管理者值得信任且能干吗?
- 安全边际:价格相对于内在价值足够便宜吗?
- 决策纪律:我的买入决定是理性的,还是出于 FOMO(错失恐惧)?
最终,它会输出一个清晰的对比表格,并附上“镜子测试”——要求你用不超过 5 句话清晰陈述买入理由。如果说不清,则自动否决。
4.4/news-pulse:股价异动快速归因
这是用于持仓管理的利器。当持仓股票突然大涨或大跌时,它能帮你快速(10-15分钟)厘清原因,避免情绪化操作。
使用示例:
/news-pulse 腾讯 /news-pulse 拼多多 跌12% 一周内核心功能:
- 四维侦察:同时从公司事件、监管政策、行业对手、市场情绪(卖方报告、大V观点、资金流向)四个维度搜集信息。
- 归因排序:不是罗列新闻,而是判断哪个事件最可能“配得上”此次股价波动的幅度。
- 性质判断:明确区分是“价值事件”(基本面变化)、 “情绪波动”、“真因不明”还是“混合型”。
- 行动建议:直接给出“触发深度研究”、“重审投资逻辑”或“仅需观察”的操作建议。
5. 金融严谨性工具:告别 LLM 的“数学幻觉”
LLM 在数学计算上的不可靠性是金融应用的一大障碍。AI Berkshire 通过本地 Python 工具链彻底解决了这个问题。
项目中的tools/financial_rigor.py提供了以下关键命令:
# 1. 市值验算:防止港币/人民币等单位混淆导致的重大错误 python3 tools/financial_rigor.py verify-market-cap \ --price 510 \ # 股价 --shares 9.11e9 \ # 总股本 --reported 4.65e12 \ # 报告中的市值 --currency HKD # 货币单位 # 输出:✅ 验证通过,偏差 0.08% # 2. 多源交叉验证:确保关键数据可靠 python3 tools/financial_rigor.py cross-validate \ --metric "PE_Ratio" \ --sources 15.3 16.1 14.8 \ # 从不同来源获取的PE值 --tolerance 0.05 # 容忍5%的偏差 # 如果某个源数据偏离过大,会发出警告。 # 3. 三情景估值计算:乐观、中性、悲观假设下的估值区间 python3 tools/financial_rigor.py three-scenario \ --base-fcf 100 \ # 基准自由现金流(单位:亿) --growth-rates "0.15 0.10 0.05" \ # 乐观/中性/悲观增长率 --wacc 0.08 \ # 加权平均资本成本 --terminal-growth 0.02 # 永续增长率 # 输出三个情景下的内在价值区间。 # 4. Benford定律检测:初步筛查财务数据异常 python3 tools/financial_rigor.py benford \ --data-file revenue_digits.csv # 收入数字列表 # 分析首位数字分布是否符合自然规律,异常可能提示财务问题。这些工具被深度集成到各个 Skill 中。当 Agent 需要计算 PE、市值或进行 DCF 估值时,会自动调用这些本地工具执行精确计算,并将结果返回给 LLM 进行推理。这保证了分析报告的数学基础是坚实无误的。
6. 实战案例:如何用 AI Berkshire 分析一家公司
让我们以分析“美团”为例,串联起核心技能的使用。
第一步:快速初筛当你对美团感兴趣时,首先用 Checklist 进行快速过滤。
/investment-checklist 美团这个过程大约2-3分钟,它会告诉你美团是否值得你花更多时间深入研究。如果输出显示在“能力圈”、“好生意”等关键关卡通过,则进入下一步。
第二步:深度并行研究启动多 Agent 团队进行全方位剖析。
/investment-team 美团等待5-10分钟,你会得到一份包含四维度评分、综合结论和具体操作建议的报告。报告可能会指出:美团在本地生活的网络效应护城河(段永平视角)很强,当前估值(巴菲特视角)处于历史低位,但需警惕抖音在到店业务的竞争(芒格视角)。
第三步:关键问题深挖如果报告中对管理层或某项新业务(如美团优选)存在疑虑,可以使用特定技能深入。
/management-deep-dive 王兴 美团这个 Skill 会聚焦于管理层的背景、历史决策、股权结构、薪酬体系等,评估其是否值得信赖。
第四步:持仓管理与跟踪假设你基于报告决定买入,后续可以使用持仓管理技能。
- 定期复盘:
/portfolio-review 美团30%, 腾讯40%, 现金30%来审视整体组合的健康度。 - 论文跟踪:
/thesis-tracker 美团来持续监控你当初买入的核心逻辑(如“外卖业务利润率持续提升”)是否被证实或证伪。 - 异动归因:某天美团股价大跌,立即使用
/news-pulse 美团,快速判断是市场情绪、行业政策还是公司基本面出了问题,避免盲目止损。
这一套流程,将一个非专业的个人投资者,武装成了一个拥有标准化研究流程、交叉验证机制和持续跟踪纪律的迷你投资机构。
7. 常见问题与排查思路
在安装和使用 AI Berkshire 过程中,你可能会遇到以下问题:
| 问题现象 | 可能原因 | 排查方式 | 解决方案 |
|---|---|---|---|
Claude Code 中无法识别/命令 | Skills 未正确安装或路径不对 | 在 Claude Code 中尝试输入/查看命令列表 | 1. 确认已运行install-claude-commands.sh。2. 检查 Claude Code 的全局 commands 目录权限。 3. 重启 Claude Code 客户端。 |
| Codex 中调用 skill 无反应 | Skill 未安装或未加载 | 在 Codex 聊天框输入使用 investment-research 研究腾讯看是否有对应动作 | 1. 确认已运行install-codex-skills.sh。2. 重启 Codex 客户端。 3. 检查 ~/.codex/skills目录下是否有对应技能文件夹。 |
| 工具调用被频繁要求授权 (Claude Code) | Claude Code 默认安全设置 | 每次调用网络搜索、文件读取时都会弹出确认 | 1. 接受授权。 2. 或在可信环境下使用 claude --dangerously-skip-permissions启动(需谨慎)。 |
| 财务数据获取失败或错误 | 网络问题或数据源不可用 | 观察 Agent 执行日志,看是哪一步数据抓取出错 | 1. 检查网络连接。 2. 项目依赖公开数据源,某些国内公司数据可能受限,可尝试使用公司股票代码(如 0700.HK)或英文名。 |
| 分析报告深度不够 | 可能受限于 Claude/Codex 模型本身的上下文和理解能力 | 对比不同模型版本(如 Claude 3.5 Sonnet vs Haiku)的输出 | 1. 确保使用能力最强的模型版本。 2. 在 Skill 调用时,可以附加更详细的指令,如 /investment-research 腾讯 请重点分析视频号对广告业务的贡献。 |
| “镜子测试”无法通过 | 对公司的理解确实不深入 | 审视报告中的“能力圈”评分和阐述 | 这可能是框架最有价值的反馈——它告诉你,你其实并不真正理解这家公司。此时应放弃投资,或回归第一步进行更基础的学习。 |
8. 最佳实践与高级使用技巧
要让 AI Berkshire 发挥最大效力,不仅在于会用,更在于用得巧。
从 Checklist 开始,用 Team 深入:不要一上来就对陌生公司使用
/investment-team,耗时且可能浪费资源。先用/investment-checklist快速过滤掉明显不符合标准的公司,对通过的标的再启动深度研究。善用“灰色地带”结论:框架的结论除了“通过”和“不通过”,还有“灰色地带”。这通常意味着数据不足或关键变量存在巨大不确定性(如政策风险、技术路径未定)。“灰色地带”不是失败,而是最重要的风险提示,它告诉你这里需要人类更高阶的判断或更长时间的观察。
交叉使用不同 Skill 进行验证:对于重点公司,可以先后使用
/investment-research(系统化)和/investment-team(并行化)进行分析,对比两份报告的侧重点和结论是否一致。也可以用/earnings-review仔细研读最新财报,验证深度报告中的财务假设。建立自己的研究档案:将 AI Berkshire 生成的所有报告保存下来。半年或一年后,对同一家公司再次运行分析,使用
/thesis-tracker对比新旧报告,看哪些判断被验证,哪些被证伪。这是提升你自身投资认知的最佳方式。理解框架的边界:
- 它不是预测工具:AI Berkshire 分析的是公司的质地和价格的关系,不预测短期股价走势。
- 它依赖公开信息:其分析质量受限于网络可获取的公开数据。对于内幕信息或未公开的细节,它无能为力。
- 它不能替代你的最终决策:框架输出的是“决策支持”,而不是“决策本身”。最后的买入、持有、卖出按钮,必须由你亲手按下,并对结果负全部责任。
关注工具层更新:定期关注项目 GitHub 仓库的更新,尤其是
tools/目录下的金融工具。作者可能会增加新的数据源接入(如通过 MCP 协议接入 Bloomberg、Wind 等)或更强大的分析工具。
9. 总结:从“玩票”到“专业”的桥梁
AI Berkshire 的出现,标志着一个转折点:AI 在专业领域的应用,正从“玩具”和“助手”,迈向“协作伙伴”和“流程引擎”。它提供的不是又一个聊天界面,而是一套可重复、可验证、具备内在制衡机制的决策系统。
对于开发者而言,这是一个绝佳的多 Agent 协作系统的实战案例,展示了如何将复杂的领域知识(价值投资)工程化为一系列可执行的 AI 技能和严谨的工具链。
对于投资者而言,这可能是第一次有机会以极低的成本,拥有一个“7x24小时工作、不受情绪影响、融合大师智慧、计算绝对精准”的个人投研团队。它不能保证你赚钱——没有任何工具可以——但它能极大地提高你投资决策过程的理性程度和纪律性。
最终,AI Berkshire 的价值不在于给出一个“必涨代码”,而在于它强制你遵循一个优秀的决策流程。在这个流程中,AI 负责提供广度、深度和计算,而你,负责提供最终的判断、勇气和承担责任的肩膀。这或许是人机协作在投资领域最理想的形态。
下一步你可以:
- 按照第 3 节的步骤,在你的 Claude Code 或 Codex 中安装并尝试第一个 Skill。
- 从一个你非常熟悉的公司(比如你所在行业的公司)开始分析,感受框架的分析逻辑与你自己认知的异同。
- 查阅项目
docs/目录下的实战报告,理解一份高质量输出应该长什么样。 - 思考如何将这套框架的“多 Agent 对抗”和“工具链严谨性”思想,迁移到你自己的专业领域中去。