Anthropic Agent SDK 计费风波背后的 Agent 经济学焦虑
2026 年 6 月 15 日,Anthropic 原定实施一项颠覆性的计费改革——将 Claude Agent SDK 从订阅池剥离,按 Token 独立计费。但在生效当天,Anthropic 发邮件叫停了这项变更。对开发者来说,这是一次"临时赦免";对行业来说,这是一面镜子——照出了 Agent 用量激增与订阅制商业模式之间日益尖锐的冲突。
一、一封邮件让开发者松了一口气——但方向不会变
2026 年 6 月 15 日清晨,无数 Claude 重度用户打开邮箱,看到了一封来自 Anthropic 的邮件。比起 5 月那封"请做好变更准备"的通知,这封邮件的口吻要柔和得多:
5 月曾预告,从今天起 Agent SDK 将不再占用订阅额度,转而使用独立的月度 Credit。现在告知大家:今天不做这项变更。Anthropic 正在重新打磨方案。眼下什么都不变——你的订阅额度照旧,没有 Credit 需要领取。
关键词是"暂停"而非"取消"。Anthropic 没有放弃为程序化用量重新定价的方向,只是把这次落地按下了暂停键,并承诺下次会给足提前量。
对开发者而言,这是一个月的宽限期。对 Anthropic 而言,这是一次临门收脚——一个已经敲定了金额、日期、实施方案的计费改革,在最后一刻被自己叫停了。这在 SaaS 行业是罕见的操作,背后的原因值得深挖。
二、被叫停的,原是怎样一套方案
2.1 程序的归程序,聊天的归聊天
5 月 14 日,Anthropic 发了一则公告,核心逻辑可以用一句话概括:把"程序化使用"和"对话式使用"彻底分账。
具体来说,以下四种用法被移出订阅额度池,转入独立的 Agent SDK Credit 池:
| 受影响用法 | 典型场景 |
|---|---|
| Claude Agent SDK | 个人脚本、编程项目中调用 Claude |
claude -p(非交互式模式) | CI 流水线中通过 CLI 调用 Claude |
| Claude Code GitHub Actions | 官方 CI 集成插件 |
| 基于 Agent SDK 的第三方应用 | OpenClaw、Conductor、Zed 等经由 ACP 接入的工具 |
交互式用法——Claude.ai 网页端、桌面端、移动端、终端内交互式 Claude Code、Claude Cowork——则完全不受影响。
2.2 新的 Credit 额度:20/20/100/$200
各档订阅对应的月度 Agent SDK Credit 如下:
| 订阅计划 | 月度 Credit | 约等于(按 Opus 价格) |
|---|---|---|
| Pro ($20/月) | $20 | ~133 万 Token |
| Max 5x ($100/月) | $100 | ~667 万 Token |
| Max 20x ($200/月) | $200 | ~1330 万 Token |
| Team Standard 席位 | $20/席 | 同上 |
| Team Premium 席位 | $100/席 | 同上 |
Credit 有严格限制:不跨成员共享、不滚存至下月、用不完即作废。
超出 Credit 额度后,用户面临二选一:开启"Usage Credits"溢出开关,按标准 API 列表价继续计费;或关闭开关,超额请求被直接拒绝直到下个计费周期。
注意,这里的"标准 API 列表价"不是订阅优惠价。以 Opus 4.7 为例,API 列表价为 15/15/75(每百万输入/输出 Token)。这意味着一名 Max 20x 用户在月度额度耗尽后,每消耗 100 万 Token 需额外支付 15–15–75。
2.3 一算账就明白:对重度 Agent 用户是核弹
做一个简单的算术:一次重度 Claude Code Agent 调试会话,在复杂多步任务中可能消耗 50 万至 100 万 Token。如果开发者每天跑 3 次 Agent 任务,一个月轻松消耗 5000 万 – 1 亿 Token。
按旧模式,这全部算在订阅额度内——200/月包干。按新模式,200/月包干。按新模式,200 Credit 只够覆盖约 1330 万 Opus Token,超额部分全部按 API 列表价计费。轻松超出 3–7 倍。
开发者社区做了一个简单对比:
| 场景 | 旧方案(月付) | 新方案(月付) | 涨幅 |
|---|---|---|---|
| 轻度 agent 使用(月 300 万 token) | $200 | ~$230 | +15% |
| 中度 agent 使用(月 2000 万 token) | $200 | ~$580 | +190% |
| 重度 agent 使用(月 5000 万 token) | $200 | ~$1120 | +460% |
| CI 流水线全天候运行 | $200 | $2000+ | +900%+ |
这组数字解释了开发者社区的愤怒。它不是"涨价",而是对某类使用模式的"重新定价"——且幅度以倍数计。
三、年内第三次反复:Anthropic 在商业可持续与开发者体验之间反复横跳
这次叫停并非孤立事件。把时间线拉开,能看到一条清晰的轨迹:
3.1 第一次:1 月封禁 OAuth Token
2026 年 1 月,Anthropic 宣布封禁在第三方工具中使用 Claude 订阅的 OAuth token。这意味着通过 Cline、Cursor 等第三方 AI 编程工具使用 Claude 订阅的能力被切断。
开发者反弹之大出乎 Anthropic 预料。Reddit、Hacker News、Twitter 上铺天盖地的批评,核心论点只有一个:"我付了 $200,凭什么限制我用什么客户端?"
数日内撤回。Anthropic 在社区压力下紧急回滚,官方声明承认"低估了用户对工具选择自由度的重视程度"。
3.2 第二次:2 月修订服务条款
2026 年 2 月,Anthropic 修订了服务条款。这次它没有一刀切断,而是采取了更精细的调整:把 OAuth 认证限制在 Claude Code 和 Claude.ai 范围内,但保留了 Agent SDK 的接入通道。
表面上看这是"听取社区反馈后的折中",但实质上是把 1 月被撤回的政策以更"体面"的方式重新落地——给开发者留了一条路(Agent SDK),但堵死了其他非官方路径。
3.3 第三次:6 月 Agent SDK 独立计费
到了 5 月的公告,Anthropic 已经换了一套打法:不封禁,但计费。
逻辑链清晰:1 月尝试堵路 → 被骂回 → 2 月堵窄路 → 6 月收过路费。
你可以用 Agent SDK、可以用claude -p、可以用 GitHub Actions——但不再享受订阅补贴价。程序的归程序,请按 API 市价付钱。
这条路径其实在商业上更合理。问题出在定价跨度过大——从补贴价跳到市价,对重度用户意味着月账单激增数倍。
3.4 叫停:不是不做了,是"再想想"
6 月 15 日的叫停邮件,措辞是"重新打磨方案"而非"取消方案"。叠加年内已有的两次反复,几乎可以确定:为程序化用量重新定价的方向不会消失,只是 Anthropic 需要更多时间来让过渡更平滑、让定价更可预测、让社区更容易接受。
值得一提的是,6 月 15 日当周有用户对 Anthropic 提起集体诉讼,指控 $200 Max 计划在未充分通知的情况下被实质性重新定价。这起诉讼的具体进展未公开,但很可能也是促使 Anthropic 按下暂停键的压力因素之一。
四、为什么 Agent 这么能吃?被忽略的 Token 真相
理解这次计费风波,要先理解一个基本事实:Agent 模式的 Token 消耗与对话模式不在一个数量级。
传统对话式使用 LLM,一次请求 ≈ 一个 prompt + 一个 completion。Token 消耗线性可预测。
Agent 模式完全不同。以 Claude Code 为例:
- 每次执行任务前,Agent 需要阅读上下文(代码文件、git diff、linter 输出、终端输出)——这一轮系统提示词可能就吃掉 5 万 Token
- 多轮思考:Agent 不是一蹴而就,而是"读取 → 推理 → 执行 → 观察 → 再推理"的循环。每次循环约消耗 2 万 – 5 万 Token
- 代码生成:一次完整的函数重写或文件修改,输出可能达到 1 万 – 3 万 Token
- 错误恢复:Agent 执行失败后会"自我调试",重新读取上下文并生成修复——这意味着失败的任务消耗更多 Token,而不是更少
把这些乘起来:一个典型的 Claude Code 任务("帮我实现这个功能并修复全部 lint 错误")可能涉及 5–8 轮 Agent 循环,每轮 3 万 – 5 万 Token,总共 15 万 – 40 万 Token。这相当于一次对话式请求的 100 倍以上。
更有冲击力的数据来自 Latent Space 在 2026 年 AIEWF 大会上披露的内部调研:Claude Code 的重度用户中,超过 60% 的程序化 Token 消耗来自 Agent 模式,而 Agent 模式的用户在订阅用户中的占比不到 15%。换句话说,15% 的用户吃掉了 60% 的 Token 资源——而这些用户的 $200 月费与轻度用户完全相同。
从商业角度,Anthropic 不可能长期维持这种交叉补贴。但从开发者角度,这份交叉补贴正是许多人愿意付 200/月而非按量付费的原因。一旦补贴取消,200/月而非按量付费的原因。一旦补贴取消,200/月买到的东西骤降,整个订阅的价值主张随之动摇。
这就是计费风波的底层矛盾:Agent 技术的跃进让 Token 消耗量级变化了,但商业模式没跟上。
五、定价困境:订阅制和 Agent 天然互斥
Anthropic 的困境不是个例。Agent 模式的 Token 消耗特性,让它与所有以"固定月费无限用"为卖点的订阅制都天然冲突。
我们可以从几个维度来看这个问题:
| 维度 | 对话式使用 | Agent 使用 |
|---|---|---|
| Token 消耗模式 | 单次、线性 | 多轮循环、指数级 |
| 用户行为 | 可预测 | 高度不可预测 |
| 月 Token 消耗峰值 | 300 万 – 800 万 | 5000 万 – 5 亿 |
| 定价模型适用性 | 固定月费可覆盖 | 固定月费必然被击穿 |
这就是为什么 OpenAI、Google、DeepSeek 等其他 AI 公司目前都采用纯按量计费的 API 模式,而将订阅制限定在 Web/App 端的交互式体验。Anthropic 的独特之处在于,它把 Agent SDK 也打包进了订阅——这在前 Agent 时代是可行的,但在 Agent 用量爆发后就成了一笔不可持续的账。
Anthropic 面临的本质上是一道选择题:
- 选项 A:继续补贴 Agent SDK → 订阅亏损加剧,等待某个季度财报暴雷
- 选项 B:Agent SDK 独立计费 → 重度开发者流失至按量付费 API 或竞争对手
- 选项 C:分层定价,给不同 Agent 用量设置不同价格档位 → 方案复杂度上升,但可能平衡两边
6 月 15 日的方案本质上是选了 B,但走得过于生猛。叫停后,Anthropic 很可能会走向 C——一个更精细化的梯度定价。
六、开发者的"账单焦虑":对行业的三重影响
这次风波的影响,远超一张账单。
6.1 自动化的成本已在墙上写清楚了
在此之前,许多开发者选择订阅制而非按量付费 API 的核心原因之一,是"固定成本、无限使用"的确定性。一个月 $200,随便跑,不用盯着每次 API 调用的 Token 计数器。
Agent SDK 独立计费(无论是这次被叫停的方案,还是未来变体)会打破这种确定性。当 Agent 的每次执行都有明确的成本,开发者不得不做出选择:
- 是否值得为一个"可能失败"的 Agent 任务支付 0.50–0.50–2.00?
- 是否能接受 CI 流水线中的自动代码审查每月增加 $300 的额外开销?
- 是否应该在 Agent 任务失败一次后就停止重试,改为手动修复?
这种"账单焦虑"将成为 Agent 工程实践中的一个新变量——与传统软件工程中的"编译时间"类似,Agent 的成本变成了一个需要持续优化和监控的指标。
6.2 "订阅 + 按量"的混合模式将成为标准
Anthropic 的方案结构——每月给固定 Credit,超额按量计费——本质上是一种混合定价。它已经在 AWS Lambda、Vercel、PlanetScale 等基础设施服务中被验证为可行。
在 AI 领域,这可能会成为新的标准:所有 Agent 能力的提供方——不仅是 Anthropic,还包括 OpenAI(GPT-5.6 Agent)、Google(Gemini Spark)、以及各种 Agent 框架和平台——都将面临相同的 Token 成本压力,最终趋向类似的定价模式。
6.3 Token 优化将从"省钱秘籍"变为"工程必需"
在纯 API 按量计费模式下,Token 优化只是一个"省钱建议"。在 Agent SDK 独立计费模式下,它会变成一个需要工程投入的必修课:
- 选择正确的模型档位:简单任务用 Haiku(0.25/0.25/1.25),复杂任务用 Sonnet(3/3/15),只在极致需求时才调用 Opus(15/15/75)
- 上下文窗口管理:Agent 的上下文是最大的隐性成本。每一次"读取整个文件"而非"读取相关函数",都在烧钱
- Agent 循环深度控制:设置合理的最大循环次数和策略,避免 Agent 在错误恢复中无限消耗 Token
- 缓存和预计算:对重复性任务(如 lint 修复、常规代码审查),缓存公共上下文部分
七、下一步:等待 Anthropic 的下一封邮件
这次叫停给开发者提供了一个窗口期。在这个窗口期内,有三件事值得做:
1. 审计你的 Agent 用量。找出过去一个月你的 Agent SDK /claude -p/ CI 的实际 Token 消耗,按 API 列表价算出理论账单。这个数字是新方案落地时的参照基准。
2. 评估替代方案。如果你的 Agent 用量不算大(月 500 万 Token 以内),订阅制可能仍然是最划算的选择。如果用量远超这个量级,直接使用 API Key 按量付费 + 降级到更便宜的模型(如备选 DeepSeek、Qwen 等开源模型用于常规任务)可能是更经济的方案。
3. 把自动化设计得"抗变"。无论 Anthropic 最终选择什么方案,唯一的确定是不确定。让自动化工作流对计费模式不敏感——可以平滑切换到独立 API Key、可以限流、可以降级到更便宜的模型——是抵御下一次变动的最好缓冲。
Anthropic 在生效当天叫停 Agent SDK 独立计费,是一次罕见的临门收脚。但措辞是"暂停"而非"取消",方向大概率不会变。
对开发者而言,这不是"逃过一劫",这是"预警信号"。Agent 正在吃掉越来越多的 Token,而每一枚 Token 都有价格。免费/补贴的 Agent 时代正在倒计时。
唯一的问题不是"还要不要收费",而是"以多快的速度、用多大的梯度"。等待 Anthropic 的下一封邮件。
参考来源:Anthropic 官方帮助中心(6 月计费变更公告)、Codersera 计费变更详细分析、The New Stack 独立 Credit 池报道、TechTimes 计费变革分析、Digital Applied Credit 测算、Context Studios 盈亏平衡分析、dranixj.com 事件梳理、ic.work 开发者反应分析