旗下矩阵

  • 投资界
  • 天天IPO
  • 解码LP
  • 并购
  • 前哨
  • 投资界AI

黄仁勋开始焦虑什么?

当所有人都在算token成本时,英伟达更在意的是——谁来定义这些token从哪里产生,谁又在引导token的消费。而真正的领先者,往往最清楚自己可能失去什么。
·微信公众号:甲子光年苏霍伊

AI投资人解读

· 英伟达在AI推理竞争中转向系统级工程能力竞争,收购Groq构建AI工厂;黄仁勋重新定价token,布局算力调度体系;OpenClaw受高度重视,有潜力成行业标准;英伟达参与算力资产建设,掌握双重信息优势。
· 行业竞争激烈,推理架构不断演进,竞品芯片频繁出现;安全、治理、隐私等是OpenClaw面临的关键议题;算力资本开支周期影响企业经营。
总结:英伟达在AI领域优势显著,通过多种方式强化自身地位,但面临竞争与新挑战,需持续创新并应对风险,以巩固行业领先地位。内容由AI生成,仅供参考

美国当地时间3月18日,「甲子光年」受邀参加了英伟达创始人兼CEO黄仁勋在GTC 2026举行的媒体会。

黄仁勋大概是整个硅谷里最不怕记者提问的CEO,他不仅与全球记者谈笑风生,还试图像管理英伟达员工一样对待记者。

现场一位记者的手机铃声响起,黄仁勋立刻停止回答,半开玩笑半严肃地说:“谁的手机,举手。”他还进一步强调,自己没什么特别不能容忍的事情,除了“开会时手机必须静音,每一位英伟达员工都知道。”而在面对最后一个提问的记者时,他反复强调:“最后一个提问很重要,你要想清楚再问。”

近两个小时、三十多个问题,几乎覆盖AI产业的每一个关键环节,可以说是一次“信息过载”的问答。

但如果把所有回答压缩,会浮现出一条清晰的主线:AI正在重建计算基础设施,而英伟达试图成为这套新秩序的定义者。

从推理架构的分层,到AI工厂的系统整合;从开源智能体的标准争夺,到全球供应链的再布局,黄仁勋给出的是一套逐渐闭环的计算版图。

而OpenClaw(俗称:龙虾)为黄仁勋带来了新的兴奋点,他在媒体会上反复提及OpenClaw并一遍遍强调其重要性,如果说主题演讲上CUDA 20周年是英伟达对过去的回顾,OpenClaw就是黄仁勋对未来的押注。他认为,ChatGPT是AI的拐点,因为它让所有人都能用上通用AI;但Agent系统一直只停留在技术行业内部,大概只有25%的软件开发者在真正使用。然后OpenClaw出现了,几周之内就成了历史上增长最快的开源项目。

看看各种龙虾的token消耗量,大家都会明白黄仁勋极力推荐OpenClaw的目的。

当所有人都在算token成本时,英伟达更在意的是——谁来定义这些token从哪里产生,谁又在引导token的消费。而真正的*者,往往最清楚自己可能失去什么。

「甲子光年」从这次媒体会上黄仁勋的回答中精选了五句话,分别是:

“英伟达不只造GPU,实际上在构建更远大的东西。”

“每个token都不是等价的。”

“OpenClaw是一件非常重要的事。”

“从很多层面来说,我们掌握着先手信息。”

“别被开除,别变得无聊,别死。(Don't get fired, don't get bored and don't die.)”

1.AI推理变革

媒体会上*个问题就直指AI推理和新发布的NVIDIA Groq 3 LPU。

黄仁勋笑着对记者说:“你正看着推理*(Inference King)。”

随后他把时间线往回拉了两年,表示英伟达从芯片精度、架构到系统互联,已经围绕推理做了好几代产品的准备。他反复强调“推理是一个巨大的计算机系统问题”,关键在于谁能够打通从芯片、互联到数据中心的整套体系。

这背后是一个更关键的判断:推理竞争,已经从单点性能竞争,转向系统级工程能力的竞争。

这也解释了英伟达为什么要通过“技术授权+人才吸纳+资产收购”的组合方式,把LPU芯片厂商Groq的核心能力“纳入体系”。

黄仁勋承认Groq在推理速度上“能打”,但现实世界的推理需求,从来不是单一维度:既要低延迟,也要支持大模型,还要承载长上下文。

单一架构无法同时满足这些需求,所以有了Groq与Vera Rubin的组合。

GTC上新发布的NVIDIA Groq 3 LPU,采用约500MB片上SRAM,并提供高达150TB/s的片上带宽,远高于传统依赖外部HBM内存的GPU架构,从而显著降低数据访问延迟。同时,其FP8算力达到约1.2 PFLOPs,晶体管规模达980亿,体现出较强的计算能力与集成度。

相比单纯追求算力规模,Groq 3 LPU更强调通过大容量片上存储与超高带宽的数据流架构,将数据“留在芯片内”高速流动,从根本上优化大模型推理过程中最关键的延迟瓶颈。

“我希望Groq的加入能让大家注意到,英伟达不只造GPU,实际上在构建更远大的东西。”黄仁勋说。

Groq加入英伟达体系后,外界也很关心黄仁勋对其的定位。

在他的规划中,一座算力工厂75%仍将是纯Vera Rubin部署,Groq与Vera Rubin的组合只占25%。Vera Rubin才是核心,Groq是侧翼。

他对自家产品很自信:“它实在太强了,我们自己都不知道如何超越Vera Rubin,否则我们早就造出能胜过它的产品了。”

在黄仁勋看来,就目前token的主流消耗场景而言,Grace Blackwell和即将到来的Vera Rubin已经无可匹敌,Groq的加入改变的是版图的边界,而不是版图的中心。

黄仁勋透露:“如果没有Dynamo,我们就无法探索解耦推理的边界,也就不会有后来收购Groq团队的决策。”引入Groq是英伟达在推理深水区持续探索的必然结果,是Dynamo让团队触及了解耦推理的技术边界,由此看清了Groq的LPU在特定维度上的价值。

Dynamo是英伟达面向大规模AI推理而打造的软件平台,本质上是一个推理基础设施编排系统(Inference Orchestration Layer)。它解决的是一个核心问题:如何把算力利用率拉到最高。

“我希望Groq之于英伟达,就如同Mellanox之于英伟达一样,是一次架构层面的重要补充。我们构建的不是一块GPU,而是一座AI工厂。”黄仁勋说。

2019年英伟达收购Mellanox时很多人同样感到费解,而黄仁勋如今将那次收购视为架构补完的成功先例,用同样的框架定位Groq,信息很清晰:他买的是AI工厂体系中一块关键的架构拼图。

2.Token定义权

如果说推理是入口,那么AI工厂才是英伟达的*形态,而AI工厂生产的就是token。

在这场记者会上,黄仁勋多次将竞争单位从“芯片”上移到“数据中心”,可以说是“三句话离不开token”。

“我们目前是成本*的token生产商,也是AI工厂中吞吐量最高的token生产商。”他列举了MLPerf、SemiAnalysis和Artificial Analysis三项基准测试,称英伟达在每一个可量化的维度上都*。

值得注意的是,黄仁勋给出了一个判断:“每个token都不是等价的。”

黄仁勋进一步解释:“token可能由小型模型、较大模型或超大型模型生成,对应的输入上下文长度也从极短到极长不等。”

在早期的大模型语境中,token几乎被默认视为“标准化单位”——无论是API计费、推理成本,还是性能对比,大家都在用“每百万token多少钱”来衡量。

黄仁勋试图对token进行重新定价:token看起来一样,但生产它们的成本结构完全不同。

为什么不同?因为一个token背后是三组变量的组合:

模型参数规模

上下文长度

推理路径

这些变量叠加后,token的计算开销会呈指数级分化。比如,一个简单问答生成的token,可能只消耗极少的算力;但一个“长上下文+复杂推理链条”生成的token,其背后可能调用了多层模型、跨多轮推理,甚至触发外部工具。这两类token在“数量上相同”,但在“成本和价值上完全不等价”。

从市场角度来看,推理市场不会再是一个“统一价格曲线”,而会分成多个子市场。

一端是*低成本、极高吞吐的“基础token生产”(类似搜索、简单问答);另一端是高价值、高复杂度的“智能token”(如Agent决策、多步推理)。中间还会形成大量分层场景。也正因如此,黄仁勋强调“市场不会只有一种解法”。

「甲子光年」认为,当token不再等价,竞争就不再只是“谁的计算的成本更低”,而是“谁能在不同类型token之间做*分配”。这正是系统级能力的体现,因为其需要同时调度不同架构(GPU、LPU、DPU等)、不同精度、不同互联方式。

以往英伟达及其竞争对手都在追求更强的芯片性能,虽然这一追求还在,但是英伟达已经开始针对不同token类型进行*生产的算力调度体系的布局。

从产业角度看,这句话也在释放一个信号:未来的AI竞争,不会简单收敛为“token价格战”,而更像是一场“算力分层与调度效率”的竞争。

谁能理解token的差异,谁才能真正参与下一阶段的游戏。

作为“Token King”,英伟达自然想掌握token定义权,而OpenClaw的横空出世,给了黄仁勋讲新故事的机会。

“如今,推理的拐点已经到来,OpenClaw出现,Agent系统正在各处广泛应用。用于推理的token生产规模才刚刚起步。”黄仁勋说。

3.反复被强调的OpenClaw

在GTC期间,黄仁勋几乎在每一个场合都会提到OpenClaw。

在主题演讲中,黄仁勋花了很长时间分享OpenClaw的作用及价值,他对OpenClaw评价极高:“OpenClaw是人类历史上*,也是*的开源项目。”他认为,OpenClaw的意义“就像当年的Linux、HTML和Kubernetes”,甚至称它在短短几周内做到的事,“超过了Linux 30年做到的事”。

而在媒体会上,黄仁勋依然在强调“OpenClaw是一件非常重要的事”。

关于Agent体验,他提到:“这种体验仅限于企业内部,局限于科技行业,尚未向大众开放。” 但突然之间,OpenClaw横空出世。我们终于拥有了一个真正架构精良的开源智能体系统。”黄仁勋在媒体会上提到,Claude Code长期以来主要面向企业级应用,因此大多数人尚未真正体验过智能体系统,“除了我们这些身处软件开发行业的人。”

可以说,OpenClaw的出现某种程度上改变了英伟达自身的战略姿态。

黄仁勋表示:“当OpenClaw出现,我们意识到世界终于拥有了一个开源智能体——我们现在几乎可以将其当作一个行业标准。”

英伟达希望尽可能多地向这个开源项目贡献能力,避免世界因此分裂成太多互不兼容的分支项目,“如果我们能将这个主项目打磨得足够优秀,全球每家公司都能以此为起点,构建自己的智能体战略。”

他也明确表示,英伟达将在未来30年间持续为OpenClaw注入能力,“就像我们持续向Linux和Kubernetes贡献代码一样”。

与此同时,英伟达推出了NemoClaw,这并不是英伟达版的OpenClaw,而是英伟达为OpenClaw提供的企业级运行与管理软件栈。

通过NemoClaw,开发者可以安装NVIDIA Nemotron开源模型和OpenShell运行环境,为AI Agent提供安全隔离的执行环境,并加入数据隐私、网络访问和策略控制等安全机制,使长期运行的AI Agent更加可靠和可扩展。

“基本上是一份经过英伟达优化、专为企业级场景打磨的OpenClaw蓝图。如今只需一行代码、一键安装,每个人都能获得一个强大的智能引擎。”黄仁勋在记者会上依然在推荐NemoClaw。

这个能力延伸到物理世界同样成立。黄仁勋提到,由于已同步攻克了认知AI,也就是AI认知领域的OpenClaw,OpenClaw在机器人内部运行已经是“相当显而易见”的设想。采用同一推理技术的智能汽车,将带动机器人技术在未来几年内实现超高速演进。在数据中心层面,运行OpenClaw配合Vera Rubin整套系统,是“非常理想的组合”。

OpenClaw的影响远不止于科技行业内部。

一位来自欧洲的记者问到了欧洲相关产业的机会,黄仁勋表示,上一次IT和软件革命对制造业来说非常陌生。制造业的文化是严格的、一步一步的,每一件产品在发货之前必须*,因为它可能伤害到人。而软件的运作方式是集群式的,你必须在它还没有完善之前就发布,因为如果你不发布,它永远不会被修复。正是这种文化差异导致美国在IT革命中全面主导,而德国却被落在了后面。

但OpenClaw改变了这个局面。“OpenClaw不需要你去编程,它只需要你告诉它该做什么。”他想对德国、日本、瑞典等国说的话是,“你们可以跨越IT革命,直接跳跃到AI革命。将AI技术与你们世界级的机电一体化工业能力深度融合,你们将一跃成为全球机器人产业的*。”

还有记者问到,随着Agent工作流的兴起,新思科技、Cadence这类传统软件平台将被取代?

黄仁勋回应:“请转告散户投资者,他们的判断完全错了。”

他指出这些设计工具的业务规模上限取决于有多少工程师在使用。未来会有大量AI智能体工程师,“这些智能体工程师会做什么?凭空生成晶体管吗?不,它们会使用和人类工程师一样的工具”,因为工作完成后,必须把结果放回人类可以理解的结构化数据中。“正因为有了智能体,我们需要授权的新思科技工具数量很可能会爆炸式增长,而不是减少。”

不过,OpenClaw面临的挑战同样真实。

黄仁勋坦言:“安全并非*的难题,但确实是一个极其严峻的问题。安全、治理、隐私,以及所有与规范化智能体系统相关的特性,都是亟待解决的关键议题。”

「甲子光年」这几天在GTC现场感受到,虽然OpenClaw很火,但黄仁勋的行为已经超过了对一个开源项目的常规背书,他更像是在反复确立一个新的行业共识。

在他的表述中,OpenClaw的重要性至少体现在三个层面:它让原本只属于少数开发者的Agent能力,开始走向更广泛人群;它具备成为“类似Linux、Kubernetes”的行业标准的潜力;更重要的是,它正在从软件系统延伸到机器人、自动驾驶和制造业,成为一种新的交互范式。

但如果把这些表述拼在一起看,会发现一个更深层的意图。

在推理和“AI工厂”的叙事之外,OpenClaw实际上补上了英伟达在上层生态中的关键一环——不仅关心token如何被生产,也开始介入token如何被消费。

某种程度上,这是一场关于“入口”的争夺。

谁定义了Agent系统,谁就定义了未来计算的调用方式;而谁定义了调用方式,谁就掌握了算力需求的流向。

也正因此,黄仁勋才会在不同场合反复强调OpenClaw。

4.站在产业链更上游

当算力变成资产,英伟达就不再只是卖铲子的人,而开始参与矿的建造。

黄仁勋在媒体会上提到,英伟达越来越多地被要求为客户的数据中心建设提供融资支持。他的回应很直接:“我们会向那些我们确信会成功的公司提供资助。”

这一变化,表面上是销售模式的延伸,本质上却是AI算力正在走向基础设施资产化的体现。

在传统IT时代,服务器是成本;而在AI时代,算力正在成为一种可以持续产出现金流的“产能”。一个1GW级别的数据中心,其投资规模、回收周期与运营方式,已经更接近发电厂而非互联网机房。

在这种背景下,英伟达的角色也在发生变化。它不仅提供GPU和系统,还通过股权投资、供应链融资以及项目级支持,直接参与到算力资产的建设过程中。

他提到英伟达投资了CoreWeave、Nscale和Nebius,认为这些都是“全垒打”级别的投资。黄仁勋解释了英伟达为什么有把握认定这些是必胜之局:“因为我们已经看到了流向它们的业务。从很多层面来说,我们掌握着先手信息。其中一些客户就是Meta、Azure、Anthropic等巨头。”

“所以英伟投资这些公司帮助这些'新星'做大的风险很低。”黄仁勋将英伟达定位为‘超级助推器’,对于流向它们的算力需求来说,也是一种正反馈的“服务价值”,“没有英伟达这些公司也能完成融资,但这是我们能融入整个生态系统的方式。”

谈及背后的投资逻辑,黄仁勋表示,英伟达的目光始终锁定在两个方向:上游供应链与下游合作伙伴。

向上游看,英伟达会推演未来2到5年的供应链需求,并提前布下先手;向下游看,则会评估未来1到5年需要怎样的落地产能(包括土地、电力、厂房设施)以及开发者生态。

他以投资Coherent和Lumentum为例,指出这是典型的上游战略布局。由于英伟达正随着Spectrum-6大规模引入硅光子技术,未来几年还会将其整合进NVLink扩展架构中,这使得未来的硅光子产能需求将远超全球现有水平。为了确保供应链不掉链子,英伟达的手段非常灵活:“有时我们支付预付款,有时提供明确的需求预测;但如果某项关键技术的产能极度紧缺且未来需求巨大,我们就会选择直接投资这家公司。”

相比之下,对Nebius的投资则属于下游生态的押注。黄仁勋用一句话总结了他的大局观:“我始终沿着整个技术与制造的生命周期进行全局扫描,以此为公司的持续增长做好万全准备。”

「甲子光年」认为,英伟达掌握着订单流与技术路线的双重信息优势,使其能够在一定程度上预判算力资产的未来现金流,这正是基础设施融资能够成立的前提。

某种意义上,AI产业正在复制能源行业的路径——从设备销售,走向产能建设,再走向资产运营。而英伟达,正在尝试站在这条链条的更上游。

5.人生哲学背后的焦虑

黄仁勋坦言,自己比以前更加忙碌。

他表示,英伟达如今的运转和项目推进速度已经创下历史新高,“说实话,我感觉自己越来越忙了,甚至比六个月前还要忙。原因就在于,工作成果的反馈更快了,项目数量的增长也更快了。”

他以日常工作为例说明了这种变化。现在员工写好产品定义或架构文档交给AI智能体,仅仅30分钟后就能拿到成果;而在过去,团队拿去开发通常需要一个月,员工在那期间可以从容地处理其他事务。“如今,那一个月已经压缩成了30分钟,你随时都在关键路径上。”

针对外界对AI抢走饭碗的担忧,黄仁勋给出了截然相反的结论:“很多人说AI来了我们会失去工作。恰恰相反,事实是:PC让我们更忙了,互联网让我们更忙了,移动设备也让我们更忙了。”据此他判断,AI将极大提升人类推进工作的速度,人们最终会承担更多的工作量。

展望十年后的英伟达,他描绘了一幅人机协同的图景:届时公司将保持约7.5万名人类员工的精简规模,但会与750万个全天候运转的AI智能体并肩作战。他提到,希望人类员工不必去硬跟智能体的工作节奏,并调侃道:“我很确定他们也跟不上。”

“每一种职业都会发生变化,有些工作会消失,有些工作则是全新的。”黄仁勋笃定地说,“世界在变,AI会改变这一切,但我相当确信,那将是一个更美好的世界。”

在媒体会的最后,黄仁勋用一种玩笑的方式,总结了他的人生哲学:“别被开除,别变得无聊,别死。”

他补充说,这三条构成一个三角,“尽量在这个三角中保持”。对应到公司层面,则是:“不要被你的客户抛弃,不要让公司变得无聊,不要倒闭。”黄仁勋说,“我已经把我人生的秘密都告诉你们了。”

如果把这段话放回这次GTC的语境中,它更像是一种被高度压缩的经营逻辑。

“不要被客户抛弃”,对应的是技术路径的不确定性。在推理架构不断演进、竞品芯片频繁出现的背景下,英伟达必须持续证明自己在系统层面的不可替代性,这也是它从GPU走向“AI工厂”的根本原因。

“不要变得无聊”,则指向生态与创新能力。当Agent成为新的计算接口,如果英伟达缺席这一层,它就有可能退回到“被调用的算力供应商”,这也解释了他为何在不同场合反复强调OpenClaw。

而“不要倒闭”,则是对当下算力资本开支周期的现实回应。当数据中心投资规模逼近能源基础设施级别,企业不仅要算性能,更要算周期、现金流与风险。

这三条是成功秘诀,也是黄仁勋的焦虑所在。

在一个仍在快速重构的计算体系中,没有任何位置是稳固的。芯片可能被替代,架构可能被重写,入口也可能被重新定义。

英伟达正在做的,是尽可能同时占据多个关键位置:在底层,它试图定义token如何被生产;在中层,它试图重构数据中心,打造AI工厂;在上层,它又试图通过OpenClaw影响token如何被消费。

但正因如此,黄仁勋也比任何人都更清楚,一旦失去其中任何一环,整个体系都会失去支点。

虽然英伟达目前依然是“Token King”,但“居安思危”对任何一家行业头部企业都十分必要。

【本文由投资界合作伙伴微信公众号:甲子光年授权发布,本平台仅提供信息存储服务。】如有任何疑问,请联系(editor@zero2ipo.com.cn)投资界处理。