英伟达眼睁睁地看着,大客户们一个接一个的自研芯片。
谷歌、微软、亚马逊……OpenAI是最新一个。
OpenAI发布首 款自研推理加速芯片Jalapeño,联合博通和Celestica合作打造。
与GPU作为通用加速器不同,Jalapeño专为ChatGPT、Codex以及未来智能体产品量身定制,从芯片到整个配套的基础设施,全都针对大模型工作负载优化。
只用9个月,从0开始设计到到流片,是迄今为止高性能先进半导体ASIC领域最快的开发周期。
到2026年底,就能初步部署。
OpenAI公告中霸气定义:这,就是全栈优势。

在OpenAI之前,谷歌、亚马逊、微软、Meta已经先后走上了自研芯片这条路。在OpenAI之后,Anthropic也在考虑自研芯片。
英伟达的超级客户清单,正在变成一份竞争对手名单。
OpenAI首 款AI芯片
为OpenAI操刀Jalapeño的是Richard Ho,前谷歌TPU团队的核心成员。
他还担任过光计算芯片公司Lightmatter的高级副总裁,更早期联合创办过EDA公司0-In Design Automation。
他的履历横跨芯片设计、AI加速和光互联三个领域,几乎是为”设计下一代AI推理芯片”量身定做的背景。

Richard Ho透露:“我们围绕对前沿AI模型最重要的内核、内存移动、网络和服务模式优化了整个架构。”
对于这类系统而言,峰值性能只是问题的一部分。更难也更重要的问题是,在生产环境中硬件究竟能发挥多大的作用。
在架构层面,Jalapeño通过减少数据搬运、平衡计算、内存和网络资源来实现更接近理论峰值的实际利用率。
博通提供了硅片实现和网络互联技术,包括其Tomahawk网络芯片,帮助将整个平台推向大规模量产。
Jalapeño计划在2026年底部署到微软及其他合作伙伴的数据中心,博通CEO陈福阳表示这是“吉瓦级数据中心”部署的开始。
目前OpenAI尚未公布任何性能基准数据,仅透露早期测试显示”每瓦性能大幅优于当前最 先进水平”,工程样片已在实验室中运行GPT-5.3-Codex-Spark。
详细技术报告预计未来几个月内发布。
英伟达大客户相继“造反”
2016年,谷歌发布了为TensorFlow定制的TPU。这是科技巨头中第 一个公开宣布自研AI芯片的,当时英伟达GPU在AI训练领域几乎没有对手。
2018年,亚马逊发布了推理芯片Inferentia。2022年又推出训练芯片Trainium,开始覆盖AI计算的完整链路。
2023年,微软亮相Azure Maia加速器,这家同时也是OpenAI最 大投资方和算力供应商的公司,选择了自己下场。
2026年6月,OpenAI发布Jalapeño。同年4月,路透社报道Anthropic正在考虑设计自己的芯片,尽管该公司尚未公开确认。
OpenAI总裁Brockman在Jalapeño发布声明中说:“世界正在迈向算力驱动的经济。”
这句话解释了所有人的动机,当算力成为核心生产资料,没有人愿意把命脉完全交给英伟达。

参考链接:
[1]https://openai.com/index/openai-broadcom-jalapeno-inference-chip/
[2]https://www.linkedin.com/feed/update/urn:li:activity:7475540055822901248/
【本文由投资界合作伙伴微信公众号:量子位授权发布,本平台仅提供信息存储服务。】
【免责声明】:本文不构成任何投资建议。市场有风险,投资需谨慎。
如有任何疑问,请联系(editor@zero2ipo.com.cn)投资界处理。





