高通打响围攻英特尔的第一枪

通过一场发布会，高通摇身一变成为“终端 AI”的代表，成功让人们忽视了英特尔才是最早主张 AI 端侧计算的企业。

2023年10月26日 08时 · 虎嗅网　丸都山　　收藏

“Oryon CPU 的开发进度甚至超过了我们自己的预期。”

北京时间 10 月 25 日凌晨，高通骁龙技术峰会正式召开。不同于以往手机厂商们排队抢首发的循规蹈矩，这次业界把焦点放在了高通专为 AI 打造的 PC 处理器骁龙 X Elite 上，一枚基于高通自研内核“Oryon”的 CPU。

在介绍这枚芯片时，高通 CEO 克里斯蒂亚诺·安蒙（Cristiano Amon）的喜悦之情也是溢于言表，苹果的 M2 Max 和英特尔的 i9-13980HX 成为活动现场的“对照组”，从单线程性能到峰值性能功耗，再到 GPU 算力和 AI 处理速度，安蒙试图用数据证明骁龙 X Elite 是一款全方位*的产品。

在移动旗舰芯片方面，虽然全新骁龙 8Gen 3 被 X Elite 抢了风头，但凭借“*专为生成式 AI 打造的移动平台”这一名头，依旧在发布会上博得满堂彩。

通过一场发布会，高通摇身一变成为“终端 AI”的代表，成功让人们忽视了英特尔才是最早主张 AI 端侧计算的企业。

而就在高通技术峰会召开前的一天，10 月 24 日，路透社报道称，英伟达和 AMD 正在开发能够用于 Windows 系统的 PC 处理器。虽然还不清楚上述产品的研发进展，但可以确定的是，两家公司的 PC 处理器同骁龙 X Elite 一样采用 ARM 架构。

英特尔曾凭借 x86 架构垄断 PC 处理器市场三十余年，但眼下英特尔的行业霸主地位，似乎在一夜之间迎来变数。

高通的蜕变，有多彻底？

在发布会开始，安蒙介绍了在端侧完成 AI 计算的必要性，基本还是那些老生常谈的观点：低成本、低时延、安全性高。但令人惊喜的是，高通把移动端平台的生成式 AI 能力抬上了一个新的高度。

相较上代产品，骁龙 8Gen 3 的 CPU 性能提升了 30%，GPU 性能提升了 25%，NPU 性能提升 25%，目前骁龙 8Gen 3 已支持运行 100 亿参数的生成式 AI 模型。如果使用搭载 8Gen 3 平台的智能手机运行 Stable Diffusion，只需不到 1 秒就可以用文本生成图像。

图片来源：高通

如果只对比参数，100 亿模型参数要较 GPT 4 和 Llama2 等云端模型少了几个数量级，但对于手机厂商而言，这样的硬件能力在现阶段已基本够用。

以小米为例，该公司在今年 4 月完成了大模型团队的搭建，8 月成功在端侧跑通 13 亿参数大模型，但目前还未正式进入公测阶段。以此推断，在下一代骁龙移动旗舰平台发布之前，骁龙 8Gen 3 足以应对手机端的训练需要。

另外，在发布会现场，高通还拉出一票软件公司站台，并表示骁龙平台现已支持微软、Meta、OpenAI、安卓、百度等公司的端侧大模型。根据此前高通与 Meta 的合作计划，最早在明年应该就能看到 Llama 2 模型在骁龙平台上运行。

相较于多模态生成式 AI 能力，骁龙 8Gen 3 在其他方面则稍显平庸，只能算是中规中矩的常规升级，但眼下行业内似乎也并不关心骁龙新的移动平台，在游戏、影像等场景下有多少提升，全场的关注点都集中在骁龙 X Elite 上。

图片来源：高通

高通方面表示，这个专为 AI 打造的骁龙 X Elite 其 AI 处理能力是竞品的 4.5 倍，异构 AI 引擎性能可达 75TOPS，支持在端侧运行超过 130 亿个参数的生成式 AI 模型，当使用基于 70 亿参数的端侧聊天助手时，每秒可处理 30 个 Token。

虽然发布会现场高通并没有标注这个“竞品”是哪款 CPU，但还是以数据的形式展示了下 Oryon 内核的“基础能力”：单线程性能超过苹果的 M2 Max 和英特尔的 i9-13980HX，峰值功耗比 M2 Max 少 30%，比 i9-13980HX 少 70%。而在多线程方面，高通还对比了英特尔的 i7-1355U，称骁龙 X Elite 的性能可达其两倍，且峰值功耗减少 68%。