旗下矩阵

  • 投资界
  • 天天IPO
  • 解码LP
  • 并购
  • 前哨
  • 野性消费吧

算力,终于像电一样被「发明」出来了

CES 2026上黄仁勋展示Vera Rubin超算架构,其推理、训练性能提升,成本降低,解决系统工程问题,还介绍了技术原理、知产战略及对AI产业的影响。
·微信公众号:知产力思岭

一、一个判断

刚刚的CES 2026上,黄仁勋带着Vera Rubin超算架构向全世界走来!Rubin的推理性能比Blackwell提升了5倍,训练性能提升3.5倍,成本降低10倍

但是,Vera Rubin,不是一代芯片,而是一种“算力生产方式”的升级如果你只把 Vera Rubin 看成“Blackwell 的 5 倍性能版”,那你低估了它。

Vera Rubin 真正做的事情只有一句话:

把 AI 算力,从“昂贵的科研资源”,变成“可以工业化生产的基础设施”。

这和当年从蒸汽机到电力的跃迁,本质是同一件事。

二、为什么 Blackwell 不够了?

我们先回到一个基本问题:

今天的 AI,卡在了哪里?

答案不是模型,也不是算法,而是——系统规模化

万亿参数模型→ 不是“单卡更强”,而是多卡协同更高效

Agentic AI、长上下文 → 不是“算得更快”,而是存得住、调得动

企业级部署→ 不是“性能峰值”,而是单位Token成本

Blackwell 解决了单卡极限问题,而 Rubin 解决的是——系统工程问题

这,是一次典型的“范式转移”。

三、Vera Rubin 的技术原理

不再堆卡,而是“把数据中心设计成一台计算机”

Blackwell 像一辆性能炸裂的超跑;

Rubin,则是把整个高速公路系统重新设计了一遍

它的关键创新,不在某一颗芯片,而在整体架构的协同设计

可以把Rubin的技术拆成四个层面看。

1.算力层:NVFP4 + 第三代 Transformer Engine

Rubin GPU 的核心,是 NVFP4 精度体系

它不是简单“更低精度”,而是:

逐层分析 Transformer 计算特性

动态调整精度、路径和算子

结果是

推理性能5倍

单 Token 成本:1/10

MoE 训练 GPU 数量:减少到 1/4

这是一种算法-硬件共设计(Co-design)的典型范式。

2.调度层:Vera CPU 的战略意义

很多人忽略了 Vera CPU。

但我认为,这是 Rubin 架构里最被低估的一步棋

88 个自研 Olympus 核心

Armv9.2 全兼容

NVLink-C2C 高速直连 GPU

它解决的不是“算力”,而是——GPU 等数据的空转浪费

在 Agentic AI 时代,调度效率=真实算力

3. 互联与存储:NVLink 6 + BlueField-4

AI 推理真正的瓶颈是什么?

不是算,是KV Cache 和上下文

Rubin 用了一个极聪明的做法:

在 GPU 内存和传统存储之间,创造“第三层上下文内存”。

由 BlueField-4 DPU 统一管理。

结果是

推理吞吐提升5 倍

72 GPU 像 一个超级 GPU 协同

推理成本直接降到1/7

4.系统级封装:NVL72 + DGX SuperPOD

这一步,才是“工业化”的关键。

72 GPU → 一个 NVL72

8 个 NVL72 → 一个 SuperPOD

数千 Agent、百万 Token 上下文 → 开箱即用

英伟达不再卖“零件”,而是卖“工厂”。

四、从知识产权角度看,英伟达做对了什么?

1.从“芯片专利”升级为“系统专利”

Rubin 的护城河,不是某一项发明,而是:

GPU 微架构

精度体系

CPU-GPU 协同

互联协议

DPU 调度

机架级封装

这是专利组合拳(Patent Thicket)

你绕过一项,绕不过系统。

2.软硬一体,锁死“可替代性”

NVFP4 精度标准

NVLink 私有互联

BlueField 数据路径

Omniverse / Cosmos / Isaac 软件栈

即使硬件被模仿,生态无法复制。

这是典型的

以架构为核心的知识产权战略

3.开源,不是放弃 IP,而是“定义标准”

Cosmos、GR00T、AlphaMayo 全家桶开源,表面看是“开放”。

但本质是

定义物理 AI 的数据格式

定义仿真的世界模型范式

定义训练-推理-仿真的三计算机体系

谁掌握标准,谁掌握未来的许可权。

五、Vera Rubin 上市后,对 AI 产业意味着什么?

判断一

“算力焦虑”将从技术问题,变成工程问题

万亿模型→ 不再是“烧钱竞赛”

企业级 AI → 成本首次可预测

长上下文、Agent → 真正跑得起来

AI 从科研,走向产业。

判断二

云厂商与模型公司,将进一步“绑定”英伟达

AWS、Azure、Google Cloud、OpenAI、Meta 首批部署 Rubin。

这意味着

下一代 GPT / Gemini / Claude

底层假设Rubin 级系统存在

这会形成新的路径依赖

判断三

物理 AI,将成为下一个十年的主战场

AlphaMayo、Cosmos、Isaac GR00T 不是“自动驾驶 demo”。

它们代表的是:

AI 从“理解文本”,走向“理解世界”。

机器人、汽车、工厂、医疗设备,都会被重构。

六、给知产人和企业的三点建议

最后,说点IP人“能用的”。

建议一

别只盯“模型专利”,要盯“系统协同专利”

未来的高价值专利,一定是:

算法× 架构 × 调度 × 数据流

单点创新,越来越难防守。

建议二

提前布局“推理侧”与“上下文管理”

训练专利红利期正在过去,

推理效率、成本、隐私计算,才是下一个金矿。

建议三

关注“标准型开源”的隐性 IP 价值

不是所有开源,都是放弃控制。

有些开源,是为了:

让全世界,按你的方式思考问题。

结  语

真正的创新,不是把事情做得更快,而是把事情做得更“便宜、更稳定、更可复制”。

Vera Rubin 做到的,正是这件事。

当算力像电一样被生产出来,一个由物理 AI 驱动的新世界,已经不可逆地开始了。

而英伟达,正在用系统级创新与知识产权,

站在这个世界的“总开关”旁边。

——这,才是 Vera Rubin 真正的意义。

【本文由投资界合作伙伴微信公众号:知产力授权发布,本平台仅提供信息存储服务。】如有任何疑问,请联系(editor@zero2ipo.com.cn)投资界处理。