旗下矩阵

  • 投资界
  • 天天IPO
  • 解码LP
  • 并购
  • 前哨
  • 投资界AI

Anthropic 造出了杀死 harness 的产品

4月8日Anthropic上线Claude Managed Agents公测,此前刚宣布年化经常性收入突破300亿美元,此次发布有多项举措及影响,值得相关各方关注。
·硅星人大模型机动组

AI投资人解读

· Anthropic上线Claude Managed Agents公测,年化经常性收入突破300亿美元。其接管第三方harness层,提供运行费计费API,早期用户反馈良好。
· 随着模型进化,harness赛道存在结构性困境。
总结:Anthropic凭借此举措增强竞争力,对相关团队和企业影响重大,其竞争对手需关注基础设施与Claude模型的绑定情况,该公司发展态势值得关注。内容由AI生成,仅供参考

from clipboard

4月8日,Anthropic 上线 Claude Managed Agents 公测。两天前,公司刚宣布年化经常性收入突破 300 亿美元。两件事放在一起看,比任何一件单独看都更说明问题。

from clipboard

这次发布的表面动作是:帮企业省去搭 Agent 基础设施的麻烦——沙箱环境、session 管理、错误恢复、权限控制,全部托管在 Anthropic 平台上,开发者只要定义 Agent 要干什么,剩下的交给 Anthropic。

真正的动作是:Anthropic 把原本属于第三方的那层自己接管了。

原文链接:https://www.anthropic.com/engineering/managed-agents

一、harness 是谁的生意

过去两年,围绕 Claude 长出来一批工具,专门做"harness"这层。

harness 的工作是让模型能干活:调用工具、管理上下文、处理报错、在任务跑了几十分钟之后还能接着跑。模型是大脑,harness 是手脚加神经系统。LangChain 做这个,OpenClaw 做这个,大量创业公司做这个。这是一门生意,因为 Anthropic 过去只卖模型,不提供跑模型的基础设施。

现在 Anthropic 把这层接管了。

Claude Managed Agents 提供的正是这套:安全沙箱代码执行、session 持久化、工具调用编排、错误恢复、权限管理,全部打包成 API,按模型用量加每小时 8 美分的运行费计费。

早期用户里有 Notion、Rakuten、Asana。Notion 把 Agent 接进工作区,支持几十个任务并行;Rakuten 在一周内给产品、销售、财务、HR 各部署了一个 Agent,接入 Slack 和 Teams;Sentry 让 Agent 自动写 bug 修复补丁并开 PR,原本预估几个月的集成,几周就上线了。

二、所有 harness 都在编码一件正在消失的事

Anthropic 工程博客的标题是《将大脑与双手解耦》,核心论点藏在*段:

harness 编码的是模型当前做不到的事,但这些假设会随着模型变强而过时。

他们给了一个例子。Claude Sonnet 4.5 会在感知到上下文窗口快到头时提前收工,工程师管这个叫"context anxiety"。解法是在 harness 里加上 context reset。但同一套 harness 跑在 Opus 4.5 上,这个行为消失了,那段 context reset 的代码变成了死重。

模型每进化一代,就有一批 harness 代码变成负担。写 harness 的人越勤快,欠下的技术债越多。

这不是某家公司的问题,是整个 harness 赛道的结构性困境:你卖的是对模型缺陷的补丁,而你的客户正在全力消除那些缺陷。

三、Anthropic 的解法是操作系统思路

工程博客的核心设计决策是把三个组件彻底分开:session(发生了什么的日志)、harness(调用 Claude 并路由工具调用的循环)、sandbox(Claude 跑代码的执行环境)。

from clipboard

原先这三个东西全塞在一个容器里。容器一旦崩溃,session 丢失,工程师要进去手动排障。Anthropic 把这种状态叫做"宠物"——需要人照顾、不能丢、一旦出问题就得蹲在旁边守着。

拆开之后,容器变成了"牲口":挂了就重启一个,session 存在外面,harness 通过 wake(sessionId) 读回事件日志继续跑。任何一个组件可以单独崩溃、单独替换,不影响其他两个。

这个改动带来的性能收益是:p50 首 token 延迟下降 60%,p95 下降超过 90%。

工程博客用操作系统做类比:OS 把硬件虚拟化成"进程"和"文件"这类抽象,抽象的寿命比任何一代硬件都长——read() 命令对 1970 年代的磁盘和今天的 SSD 都能跑。Managed Agents 在做同样的事:把 Agent 的核心组件虚拟化成稳定接口,让上层逻辑不随模型和架构的升级而失效。

安全边界也在这次重设。旧设计里,Claude 生成的代码和系统凭证跑在同一个容器,prompt injection 只需要说服模型读一下自己的环境变量就能拿到 token。新设计里,沙箱永远触碰不到凭证,认证走 vault 加代理,harness 对所有凭证无感知。

四、OpenClaw 被踢之后,Anthropic 给了自己的答案

4月4日,Anthropic 宣布 Claude Pro 和 Max 订阅用户不能再用订阅额度跑 OpenClaw 这类第三方 Agent 框架——继续用要切换成按量付费。

原因很简单:一个 $200/月的 Claude Max 订阅,可以跑价值 $1000 到 $5000 的 Agent 计算任务。人类用户一天睡觉,Agent 不睡。订阅定价是为人类行为建模的,不适配 Agent 的使用模式。

先把第三方 harness 的廉价用量断掉,再推出自己的托管方案,两步之间相差四天。

路径很清晰:Anthropic 在把 Agent 的运行层从第三方工具里拉回自己的平台。企业客户一旦把 Agent 跑在 Anthropic 托管的基础设施上,数据管道、监控配置、操作流程都嵌进日常工作,迁移成本会持续上升。这是企业软件里最经典的锁定逻辑。

五、谁该认真看这件事

对现在在做 Agent 基础设施的团队,这次发布是一个信号:平台层在向上扩张。不是*次,也不会是最后一次。LangChain 当年的处境,值得重新想一遍。

对在用第三方 harness 工具的企业,变化可能暂时感受不到,但比较基准已经变了——Managed Agents 提供的是 Anthropic 调优过的基础设施,性能数据摆在那里。

对 Anthropic 的竞争对手,更值得关注的问题是:这套基础设施是否绑定了 Claude 模型本身?如果是,那它对客户的吸引力,部分来自模型质量,部分来自迁移成本。两者叠加,护城河会比看上去更厚。

Anthropic 工程博客的最后一句话是:"我们对接口的形态有主见,但对 Claude 将来需要什么具体的 harness 没有主见。"

读起来是技术上的谦逊,但做到这一点的前提,是他们已经控制了接口本身。

【本文由投资界合作伙伴硅星人授权发布,本平台仅提供信息存储服务。】如有任何疑问,请联系(editor@zero2ipo.com.cn)投资界处理。