旗下微信矩阵:

又一芯片巨头濒临破产,GPU赛道竞争加剧

从全球GPU整体市场情况来看,全球GPU市场现已形成三足鼎立的寡头竞争格局,NVIDIA仍是全球独立GPU绝对领导者。
2024-05-16 11:24 · 微信公众号:半导体产业纵横  鹏程   
   

近年来,许多芯片企业破产。去年高达上万家芯片公司关门大吉,平均每天倒31家。而今年依旧惨不忍睹,中国IP设计新星华夏芯破产清算,砺算科技也因烧光3亿人民币,去年6月爆发欠薪,加上美元基金撤离,险些在流片前夕破产。

砺算科技成立于2021年,实际营运从2022年年初成立砺算上海开始。砺算上海是南京砺算科技的全资子公司,也是公司核心所在。三位创办人分别是宣以方、孔德海及牛一心,都在硅谷GPU公司S3拥有深厚的技术能力及工程经验。

官网信息显示,砺算科技坚持自研架构、自主知识产权,正在打造对标国际主流产品的国产GPU芯片,服务国内2000亿渲染GPU全方位市场,实现端、云、边的图形渲染,满足学习工作娱乐、元宇宙、游戏动漫、数字孪生、影视制作、ARVR、智能工厂、专业设计、智能座舱、智慧医疗等的芯片和算力的需要。

好在,东芯股份于近日发布公告,宣布拟使用自有资金或超募资金对砺算科技(上海)有限公司进行增资,占股比例不超过40%,金额上限为2亿元。砺算科技破产波澜背后折射的是GPU芯片赛道竞争加剧。

01

GPU的起源

GPU的全称是Graphics Processing Unit,图形处理单元。它最初的功能主要用于绘制图像和处理图元数据的特定芯片,后来增加了许多其他功能。

GPU相比CPU更加适合于密集型数据处理。从芯片微架构上看,GPU是在原有CPU结构基础上进行了优化与调整,通过与CPU进行合并,实现RAM共享的同时,采用SIMD架构,构建成百上千个逻辑运算单元,实现同一时间的并行处理。

GPU特别擅长同时处理很多任务,比如把计算机里的数据转换成我们在屏幕上看到的精美图像。在计算任务中,GPU利用其并行计算优势加速处理如深度学习训练、科学计算等大规模数据密集型任务。

1962年,麻省理工大学的博士伊凡·苏泽尔的论文以及他的画板程序奠定了计算机图形学的基础。1962-1984年,这一阶段,没有专门的图形处理硬件,图形处理任务都由CPU完成。

随着计算机的发展,图像处理需求逐步增加。追溯GPU的历史,要从图形显示控制器说起。世界上*台个人电脑IBM5150于1981年由IBM公司发布,这台PC搭载了黑白显示适配器(monochrome display adapter,MDA)和彩色图形适配器(color graphics adapter,CGA),这便是最早的图形显示控制器。1984年,美国SGI公司推出了面向专业领域的高端图形工作站。1984-1995年,SGI又不断研发出了一系列性能更好的图形工作站。

1995年,3DFX公司发布一款消费级3D显卡Voodoo。此时,图形显示硬件赛道已经开始变得火热,AMD、ATI(2006年被AMD收购)、NVIDIA都开始推出自己的显卡产品。CPU得以摆脱部分图形处理任务,但是顶点变换等任务仍需CPU完成。

成立于1993年的NVIDIA是GPU概念的提出者。1999年NVIDIA发布的GeForce 256图形芯片,首次引入GPU的概念,GPU时代来临。GeForce 256采用了“T&L”硬件,立方环境材质贴图和顶点混合等先进技术。

在这一时期,各硬件单元形成一条图形处理流水线,每个流水级功能固定,不可对硬件进行编程。随着技术的发展,GPU从只能按照固定方式工作变成了可以编程的智能芯片,并且能够创造出更复杂的视觉效果。2003年,NVIDIA和ATI发布的新产品都同时具备了可编程顶点处理和可编程像素处理器,具备了良好的编程性。

进入21世纪,随着游戏和多媒体应用的普及,GPU的性能需求迅速增长。各大芯片厂商纷纷投入巨资研发新一代GPU,不断提高其性能。在这个阶段,GPU的内部组成也发生了显著变化,包括图形显存控制器、压缩单元、BIOS、图形和计算整列、总线接口、电源管理单元、视频管理单元等。

随着人工智能和深度学习技术的兴起,GPU的应用领域得到了进一步拓展。NVIDIA开发出CUDA技术,使得GPU不仅能画图,还能干更多非图形类的工作,例如处理大数据。除了传统的图形渲染外,GPU还被广泛应用于深度学习、机器视觉、大数据分析等领域。这种趋势推动了GPU技术的进一步发展,使其逐渐从专用图形处理器演变为通用计算平台。

国内开始涌现出一批研发GPU的企业:景嘉微电子,芯源微电子,壁仞科技等。

直到2014年4月,景嘉微才成功研发出*国产高性能、低功耗GPU芯片——JM5400。2018年8月,景嘉微自主研发的新一代高性能、高可靠GPU芯片-JM7200流片成功。2019年,景嘉微在JM7200基础上,推出了商用版本——JM7201,满足桌面系统高性能显示需求,并全面支持国产CPU和国产操作系统。

2020年,芯片行业掀起了创业热潮,这次主要集中在GPU领域。国产GPU在资本的加持下获得了飞速发展,大量公司进入这一领域。此外,中央和地方不断出台政策支持集成电路产业发展,在这样的综合影响下,可以说GPU迎来了*的时代。这些创业公司主要致力于开发能够同时满足图形处理和AI计算的GPU,也即现在国内所说的GPGPU(通用GPU,General-purposeGPU)。但随着融资资金耗尽,部分企业也陷入破产边缘。

根据IDC数据,2022年全球AI芯片市场将达352亿美元。其中GPU占比*,Goldman预计到2025年GPU占比将达到57%。在美国限制中国进口最新的英伟达GPU产品的情况下,国产GPU前景广阔。

02

全球GPU呈三足鼎立寡头竞争格局

从全球GPU整体市场情况来看,全球GPU市场现已形成三足鼎立的寡头竞争格局,NVIDIA仍是全球独立GPU**。Intel得益于在笔记本电脑及传统PC行业的优势,现已在集成GPU市场独占鳌头,独立GPU市场则主要由NVIDIA和AMD两家公司占据。

NVIDIA现在*的独立显卡生产销售商,旗下有民用的Geforce系列,还有专业的Quadro系列。其GPU具有cuda通用运算,PureVideo高清视频技术,PhysX物理加速,Optimus智能显卡切换等。今年三月份,英伟达推出新一代AI图形处理器芯片(GPU)架构Blackwell,并重磅发布采用该架构的GPU——B200和GB200产品系列。据了解,Blackwell可以支持多达10万亿参数的模型进行AI训练和实时LLM推理。B200由两个超大型Die(裸片)封装组合而成,内含超过2080亿个晶体管,是前一代800亿个晶体管的两倍以上,整块芯片还封装有192GB高速HBM3e显存。

Intel是全球*的集成GPU供应商。Intel的GPU主要是集成显卡,用于intel的主板和intel的笔记本。英特尔首代独立显卡于2022年发布,距今大致已有2年。近日,有媒体报道,英特尔向oneAPI DPC++ 编译器的 LLVM 文档添加了 bmg_g21(Battlemage G21、BMG-G21)核心相关代码。这也是首次有 Battlemage 架构独显相关代码现身该文档,暗示 Battlemage G21 GPU 有望成为英特尔下代独显首发型号。

AMD成立于1969年,是目前业内稀缺的可以提供高性能CPU、高性能独立显卡GPU、主板芯片组三大组件的半导体公司。2006年,AMD以54亿美元收购了ATI,成为了*家可以同时设计高性能CPU和GPU的半导体公司。AMD旗下有民用的Radeon系列,还有专业的FireGL系列等。其GPU具有Stream通用运算,ATI Video Converter视频转码,UVD高清视频技术,Havok、Bullet和Pixelux DMM三种物理引擎等。AMD 的 GPU 分为两个截然不同的产品领域,一个是针对游戏的,另一个是用于超级计算机、大数据分析和机器学习系统的。

2023年,AMD正式发布了新一代AI/HPC加速器Instinct MI300X、Instinct MI300A,一个是传统GPU加速器,一个是*的CPU+GPU融合加速器。MI300A 是面向 HPC 产品定位,因此产品形态是CPU+GPU/APU 合封 Chiplet 的方式(24个Zen4 core及其I/0,128G HBM3,封装了13个Chiplet) ; 并改造了底层IF高速互连和UMA内存架构。首批采购方也是美国国家超算 (EI Capitan Exascale)。对标英伟达的CUDA,AMD则开发了ROCm。

03

国内GPU市场百花齐放

虽然国内GPU起步晚,但得益于近年来资本的加持和人工智能的市场催化,大量公司切入这一赛道。随着国内信息产业图形处理和加速计算需求的不断涌现,国内GPU市场已呈现出“百花齐放”的态势,其中不乏一些表现出色的企业和产品。

景嘉微是国内首家实现自主研发国产化GPU并产业化的企业。为打破ATI公司(现已被 AMD 收购)M9 芯片在军用图形显控领域的长期垄断,公司历经多年技术钻研,于2014 年成功研制国内*高性能GPU芯片JM5400,实现军用GPU国产化。2018年8月公司成功研发第二代图形处理芯片JM7200,并于2020年陆续完成与国产化设备的适配工作,逐步向通用领域拓展。2021年12月,公司正式发布第三代图片处理芯片JH920。该芯片在产品性能和工艺设计上较前两代产品大幅提升的同时,也为国产化GPU在人工智能、信息系统等领域带来新的突破。

芯动科技是一家专注半导体领域IP定制、设计、流片的公司,从DDR到接口再到GPU均有涉猎。2021年年底,芯动推出的“风华1号”就是一款12nm的高性能显卡,支持4路4K60帧输出,最高支持16个1080P用户同时在线,填补了国产4K级桌面显卡和服务器级显卡两大空白。“风华”系列GPU 自带浮点和智能3D图形处理功能,全定制多级流水计算内核,可实现高性能渲染和智能AI算力,适用于元宇宙、云游戏、云桌面、AI计算等领域。

由前英伟达全球副总裁张建中创办,成立于2020年的摩尔线程,致力于研发全球*的自主创新GPU知识产权,其GPU产品线覆盖通用图形计算和高性能计算。公司核心成员主要来自NVIDIA、微软、Intel、AMD、ARM等全球知名芯片企业,覆盖GPU研发设计、生产制造、市场销售、服务支持等完整架构。在成立1年后便发布了*代MUSA系统架构GPU“苏堤”,其中的顶配桌面级显卡MTT S60,拥有2048个MUSA核心,主频达1.5GHz,提供6T FLOPS的单精度浮点计算能力,板载8GB显存,板载DP1.4和HDMI 2.1接口并支持*8K视频输出。

龙芯中科于2020年成立GPU突击队,加快GPU产品的研发设计。目前,龙芯中科自主研发的GPU集成在7A2000中。龙芯7A2000是面向服务器及个人计算机领域的第二代龙芯3号系列处理器配套桥片,在7A1000基础上实现全面的优化升级。此外片内首次集成了自研GPU,采用统一渲染架构,搭配32位DDR4显存接口,*支持16GB显存容量。

芯瞳半导体成立于2019年12月,主要业务包括GPU芯片设计、异构计算平台方案、嵌入式显示系统解决方案、GPU应用部署解决方案。公司GPU架构采用了业界主流的统一渲染架构,并具有高度可扩展的互联结构和计算阵列。2023年,芯瞳GB2062正式对外发布,这是芯瞳半导体推出的第二代自主研发高性能图形处理器芯片。该芯片采用12nm CMOS工艺,具有自主设计、更强功能、更低功耗等特点,可广泛适用于三维图形领域(CAD、GIS、动画模型、电脑游戏等)和通用计算(GPGPU)领域。

壁仞科技创立于2019年,致力于研发原创性的通用计算体系,建立高效的软硬件平台,同时在智能计算领域提供一体化的解决方案。BR100是由壁仞科技发布自主研发的*通用GPU芯片,其16位浮点算力达到1000T以上、8位定点算力达到2000T以上,单芯片峰值算力达到PFlops(1PFlops等于1000万亿次浮点指令/秒)级别。

天数智芯成立于2015年12月,2018年正式启动GPGPU芯片的设计研发工作,是国内首家GPGPU高端芯片及超级算力提供商。2021年1月,其成功自主研制7纳米GPGPU高端自研云端训练芯片,具有全方位生态兼容、高性能有效算力、指令集编程架构以及软硬件全栈支持等优势。

此外,还有许多公司在研发GPU产品。

【本文由投资界合作伙伴微信公众号:半导体产业纵横授权发布,本平台仅提供信息存储服务。】如有任何疑问,请联系(editor@zero2ipo.com.cn)投资界处理。