Anthropic 造出了杀死 harness 的产品

from clipboard

4月8日，Anthropic 上线 Claude Managed Agents 公测。两天前，公司刚宣布年化经常性收入突破 300 亿美元。两件事放在一起看，比任何一件单独看都更说明问题。

from clipboard

这次发布的表面动作是：帮企业省去搭 Agent 基础设施的麻烦——沙箱环境、session 管理、错误恢复、权限控制，全部托管在 Anthropic 平台上，开发者只要定义 Agent 要干什么，剩下的交给 Anthropic。

真正的动作是：Anthropic 把原本属于第三方的那层自己接管了。

原文链接：https://www.anthropic.com/engineering/managed-agents

一、harness 是谁的生意

过去两年，围绕 Claude 长出来一批工具，专门做"harness"这层。

harness 的工作是让模型能干活：调用工具、管理上下文、处理报错、在任务跑了几十分钟之后还能接着跑。模型是大脑，harness 是手脚加神经系统。LangChain 做这个，OpenClaw 做这个，大量创业公司做这个。这是一门生意，因为 Anthropic 过去只卖模型，不提供跑模型的基础设施。

现在 Anthropic 把这层接管了。

Claude Managed Agents 提供的正是这套：安全沙箱代码执行、session 持久化、工具调用编排、错误恢复、权限管理，全部打包成 API，按模型用量加每小时 8 美分的运行费计费。

早期用户里有 Notion、Rakuten、Asana。Notion 把 Agent 接进工作区，支持几十个任务并行；Rakuten 在一周内给产品、销售、财务、HR 各部署了一个 Agent，接入 Slack 和 Teams；Sentry 让 Agent 自动写 bug 修复补丁并开 PR，原本预估几个月的集成，几周就上线了。

二、所有 harness 都在编码一件正在消失的事

Anthropic 工程博客的标题是《将大脑与双手解耦》，核心论点藏在*段：

harness 编码的是模型当前做不到的事，但这些假设会随着模型变强而过时。

他们给了一个例子。Claude Sonnet 4.5 会在感知到上下文窗口快到头时提前收工，工程师管这个叫"context anxiety"。解法是在 harness 里加上 context reset。但同一套 harness 跑在 Opus 4.5 上，这个行为消失了，那段 context reset 的代码变成了死重。

模型每进化一代，就有一批 harness 代码变成负担。写 harness 的人越勤快，欠下的技术债越多。

这不是某家公司的问题，是整个 harness 赛道的结构性困境：你卖的是对模型缺陷的补丁，而你的客户正在全力消除那些缺陷。

三、Anthropic 的解法是操作系统思路

工程博客的核心设计决策是把三个组件彻底分开：session（发生了什么的日志）、harness（调用 Claude 并路由工具调用的循环）、sandbox（Claude 跑代码的执行环境）。

from clipboard

原先这三个东西全塞在一个容器里。容器一旦崩溃，session 丢失，工程师要进去手动排障。Anthropic 把这种状态叫做"宠物"——需要人照顾、不能丢、一旦出问题就得蹲在旁边守着。

拆开之后，容器变成了"牲口"：挂了就重启一个，session 存在外面，harness 通过 wake(sessionId) 读回事件日志继续跑。任何一个组件可以单独崩溃、单独替换，不影响其他两个。

这个改动带来的性能收益是：p50 首 token 延迟下降 60%，p95 下降超过 90%。

工程博客用操作系统做类比：OS 把硬件虚拟化成"进程"和"文件"这类抽象，抽象的寿命比任何一代硬件都长——read() 命令对 1970 年代的磁盘和今天的 SSD 都能跑。Managed Agents 在做同样的事：把 Agent 的核心组件虚拟化成稳定接口，让上层逻辑不随模型和架构的升级而失效。

安全边界也在这次重设。旧设计里，Claude 生成的代码和系统凭证跑在同一个容器，prompt injection 只需要说服模型读一下自己的环境变量就能拿到 token。新设计里，沙箱永远触碰不到凭证，认证走 vault 加代理，harness 对所有凭证无感知。

四、OpenClaw 被踢之后，Anthropic 给了自己的答案

4月4日，Anthropic 宣布 Claude Pro 和 Max 订阅用户不能再用订阅额度跑 OpenClaw 这类第三方 Agent 框架——继续用要切换成按量付费。

原因很简单：一个 $200/月的 Claude Max 订阅，可以跑价值 $1000 到 $5000 的 Agent 计算任务。人类用户一天睡觉，Agent 不睡。订阅定价是为人类行为建模的，不适配 Agent 的使用模式。

先把第三方 harness 的廉价用量断掉，再推出自己的托管方案，两步之间相差四天。

路径很清晰：Anthropic 在把 Agent 的运行层从第三方工具里拉回自己的平台。企业客户一旦把 Agent 跑在 Anthropic 托管的基础设施上，数据管道、监控配置、操作流程都嵌进日常工作，迁移成本会持续上升。这是企业软件里最经典的锁定逻辑。

五、谁该认真看这件事

对现在在做 Agent 基础设施的团队，这次发布是一个信号：平台层在向上扩张。不是*次，也不会是最后一次。LangChain 当年的处境，值得重新想一遍。

对在用第三方 harness 工具的企业，变化可能暂时感受不到，但比较基准已经变了——Managed Agents 提供的是 Anthropic 调优过的基础设施，性能数据摆在那里。

对 Anthropic 的竞争对手，更值得关注的问题是：这套基础设施是否绑定了 Claude 模型本身？如果是，那它对客户的吸引力，部分来自模型质量，部分来自迁移成本。两者叠加，护城河会比看上去更厚。

Anthropic 工程博客的最后一句话是："我们对接口的形态有主见，但对 Claude 将来需要什么具体的 harness 没有主见。"

读起来是技术上的谦逊，但做到这一点的前提，是他们已经控制了接口本身。

【本文由投资界合作伙伴硅星人授权发布，本平台仅提供信息存储服务。】如有任何疑问，请联系（editor@zero2ipo.com.cn）投资界处理。

Anthropic 造出了杀死 harness 的产品

AI投资人解读

相关资讯

华裔领衔神秘小队，护航Anthropic「玻璃之翼」

别怪 Anthropic 不开放新模型 Mythos，它实在太危险了

Anthropic 终于如愿以偿，亲手训出了「强大到威胁人类」的Mythos

国产大模型：这次剧本不一样

Anthropic拒绝龙虾吃自助餐

镁信健康与上海人工智能实验室有限公司签署合作备忘录：紧跟“人工智能+”国家战略，携手构建高质量医疗保障生态

关于我们

对外合作

投稿邮箱

联系我们

投资界微信

投资界APP