文 | 强调Next
5月6日凌晨,Anthropic在旧金山召开了第二届开发者大会。首席产品官Ami Vora开门见山地表示:“今天不发新模型,只谈产品。”
话虽如此,整场大会的料却很足,核心围绕三点展开:一是通过与SpaceX合作解决算力产能问题;二是将Claude Code全面工具化与平台化;三是赋予了Claude“自我进化”的能力,现在的智能体不再只会机械执行,而是学会了自我复盘与评估。
01.马斯克的“废弃”算力,成了Anthropic的救命稻草
大会最意外的消息,是Anthropic宣布与SpaceX签约。
根据协议,Anthropic将接管SpaceX旗下Colossus 1数据中心的全部算力。300兆瓦新增容量。22万张英伟达GPU,包括H100、H200和最新的GB200。一个月内完成接入,当天起生效。
算力缓解直接带来用户侧的变化:Claude Code五小时滚动用量上限全线翻倍(Pro/Max/Team/企业版),高峰期限流取消,Claude Opus系列的API速率大幅提升,部分层级的每分钟输入Token上限提升逾15倍。
马斯克此前公开称Anthropic“misanthropic and evil(反人类且邪恶)”,长期与Dario Amodei关系剑拔弩张。 但就在大会宣布当天,马斯克在X上发文称,他在与Anthropic高层团队深入接触后“印象深刻”,认为Claude“大概率”是对人类有益的。
马斯克的“变脸”一点都不奇怪。xAI的训练场早就搬到了Colossus 2,剩下的1号机房空着也是交电费。商人的和解从来不靠情怀,靠的是Anthropic给的实在太多了。
但Musk在协议里保留了一个条款:若Anthropic的AI做出危害人类的行为,SpaceX有权收回算力。这个条款看起来像安全声明,实际上是一个实质性的控制权安排。这也留了个后手:马斯克在协议里藏了个“自毁开关”。只要他觉得Anthropic“不安全”,随时能拔掉插头。这种合作,更像是Anthropic在饮鸩止渴。
这个脆弱性,Anthropic是清楚的。此前已陆续签下亚马逊(最高5GW,2026年底前落地近1GW)、谷歌+Broadcom(5GW,2027年起)、微软+英伟达(300亿美元Azure容量)。但那些算力最快年底才能上线。SpaceX的Colossus 1是目前唯一能即刻交付的选项。
Anthropic也别无选择。
值得注意的一个隐患是,Colossus 1数据中心位于孟菲斯,环保记录不佳 ,Anthropic的合规团队或许需要提前备好话术。
Anthropic还表达了与SpaceX合作开发多吉瓦轨道AI算力的兴趣,后者此前已向FCC提交文件,计划发射百万颗卫星建造轨道数据中心。这只是初步意向,但它描绘出一幅算力基础设施的太空想象。
02.Claude Code:从编码助手到工程基础设施
大会宣布API调用量过去一年同比增长17倍,Claude Code是这一数字背后最重要的增长引擎。本次大会集中展示了其过去数周密集迭代的十余项能力,方向已从“终端里的AI编程助手”转向“工程团队的异步自动化基础设施”。
核心功能矩阵如下:
Routines(例程自动化):Routines支持从调度计划、GitHub事件或API调用触发云端智能体,在云端环境(4核CPU、16GB内存)中对接GitHub仓库运行,无需本地电脑保持开机,也不受Token用量限制。实际效果是,开发者配置好Routines之后,早上醒来可以直接看到已准备好合并的Pull Request。
Code Review(多智能体代码审查):自动化PR审查系统,同时调度多个专项智能体并行分析变更——分别负责CLAUDE.md规范合规检查、Bug发现、Git历史上下文分析、历史PR评论回顾以及代码注释核验;每条发现按0至100的置信度评分,默认只有置信度≥80的问题才会自动发布评论,以减少误报噪音。
CI Auto-fix:对PR自动提交修复建议,目标是“PR所有者永远不会看到一个红叉”,Claude在后台自动触发Claude Code执行修复。
Remote Agents:允许开发者用手机远程控制本地电脑上正在运行的Claude Code会话。
Ultraplan:在云端草拟计划方案,在Web编辑器中审阅和评论,然后选择远程运行或拉回本地执行,首次运行自动创建云端环境。
/ultrareview:在云端并行运行多个智能体进行代码审查,并提供当前用量说明的/usage指令。
这些功能组合起来,形成清晰的产品逻辑:Claude Code不再只是帮工程师写代码的副驾,而是要嵌入整条PR流水线,从生成代码、到异步审查、到CI修复、到自动合并,全程可以无人值守。Mercado Libre(拥有23,000名工程师)表示,目标是在今年Q3实现90%的编码自动化。
Anthropic还在大会上提出“advisor策略”:让更强大的Opus模型按需为Sonnet等轻量模型提供建议,在基准测试中同时实现了更高得分和更低成本。一家客户“eve”借此做到了以5倍更低成本获得旗舰模型质量的输出。
03.Managed Agents三大新能力:智能体开始“自我进化”
如果说Claude Code的更新是工程能力的横向扩张,那么Claude托管智能体(Managed Agents)的三项新功能则指向更纵深的架构演进。
Dreaming(梦境记忆蒸馏):这是一个定期运行的后台进程,审阅过去的智能体会话和记忆库,提取规律,整理记忆,让智能体随时间推移自我改进。Dreaming能发现单个智能体观察不到的跨会话模式:哪些错误反复出现、智能体倾向于收敛到哪些工作流、团队成员间共享的偏好。 开发者可自主决定Dreaming的干预力度,完全自动更新,或每次变更由人类审核后生效。
Outcomes(结果驱动执行):开发者通过定义“成功标准”的评分标准(rubric),让智能体以此为目标工作;一个独立的评分智能体在隔离上下文中评估输出,评分不受主智能体推理过程的干扰;评分未达标时,评分智能体指出需要改进的具体位置,主智能体据此重新执行。
Multiagent Orchestration(多智能体编排):当任务量超过单个智能体的处理能力,主导智能体可将工作拆解并委派给各专项子智能体——每个子智能体拥有独立的模型配置、系统提示和工具集;子智能体在共享文件系统上并行工作,并向主导智能体贡献结果;所有步骤可在Claude Console中完整追溯:哪个智能体在什么时间做了什么,以及为何如此执行。
已有实际案例:法律科技公司Harvey用多智能体编排处理复杂法律文书的协同起草;Netflix的平台团队构建了日志分析智能体,可并行处理数百个构建批次,并自动过滤出值得关注的跨批次规律;写作平台Spiral Every使用多智能体和Outcomes功能打造写作智能体,主导智能体运行Haiku处理请求分发,子智能体运行Opus进行实际写作,每篇草稿都根据编辑原则和用户风格进行打分。
Dreaming是这三项能力中最具概念野心的。它让智能体从“每次从零出发”转向“跨会话累积学习”,这是AI从工具向协作者演进的关键跨越——尽管目前仍处于研究预览阶段。
04.平台化战略的更大图景
本次大会还附带公布了金融服务领域的专项布局:Anthropic推出了十款新的Cowork和Claude Code插件,整合了微软365套件(Word、Excel、PowerPoint等),新增多个连接器,并发布了面向金融服务和保险机构的MCP应用。 这是Anthropic向监管合规型行业纵深渗透的信号。
Anthropic的API平台调用量一年翻了17倍,但依赖单一基础设施的脆弱性在这一年也以开发者抱怨的形式充分暴露。SpaceX协议的达成,既是产能危机的短期解法,也是Anthropic“计算基础设施多元化”战略的最新证明:从亚马逊、谷歌、微软到马斯克,Anthropic在用极具争议性但极具效率的方式,把自己从一家模型公司转型为一家算力依赖型平台公司。
而Claude Code在大会上主动强调的那个趋势,或许才是最值得关注的结构性变化:管理层和高管正在重新拿起代码,因为有了Claude Code,不需要投入太多时间,就能有效地参与工程贡献。 当编码的门槛降低到这个程度,“开发者工具”和“生产力基础设施”之间的边界就会开始消失。这才是Anthropic真正想要抢占的位置。
05.结语
这是一场关于“怎么让现有模型产生更大实际价值”的工程宣言。Anthropic用SpaceX的GPU买下了喘息空间,用十余项Claude Code功能向开发者兑现了承诺,用Managed Agents的三个新概念描绘了智能体自主进化的未来路径。
对于中国的AI从业者而言,这场大会有一个值得拿来对照的坐标:国内的Manus、字节Coze、阿里的智能体平台都在追赶这条“Agents as Infrastructure”的叙事路线,但在“让智能体跨会话自我学习”这个维度上,Dreaming是目前公开亮相的最系统化尝试。
当国内厂商还在卷Agent平台怎么“零代码”上手时,Anthropic已经去卷“跨会话自我演进”了。这已经不是“工具”的竞争,而是“员工”成熟度的竞争。