旗下矩阵

  • 投资界
  • 天天IPO
  • 解码LP
  • 并购
  • 前哨
  • 投资界AI

「华为天才少年」创业,行云集成电路完成超4亿元融资

行云成立于2024年,专注面向大模型推理的新一代GPGPU芯片。技术上打造超大显存规格、极致CUDA兼容的全自研产品,公司目标直指AI大模型推理的普惠化。
·投资界讯

AI投资人解读

· 行云成立于2024年,专注新一代GPGPU芯片,获超4亿元融资。其创始人背景深厚,技术路径独特,放弃HBM采用LPDDR等降低成本,构建软硬件协同壁垒,产品面向消费级价位。
· 行业竞争激烈,技术更新快,产品量产及市场接受度存在不确定性。
总结:行云团队实力较强,技术有创新性,若能成功量产推向市场,有望在AI芯片领域占据一席之地,但需关注竞争与量产风险,建议持续跟踪其技术进展与市场表现。内容由AI生成,仅供参考

投资界(ID:pedaily2012)4月17日消息,国内全自研GPGPU创新企业「北京行云集成电路有限公司」(以下简称"行云")宣布连续完成Pre-A及Pre-A+多轮融资,融资金额超4亿元人民币。本轮由五源资本、赛富投资基金、春华资本联合领投,北京、江苏等地方国资、佰维存储、金沙江联合带动全球知名GPU企业创始人家办、创维资本等产业资本跟投。云岫资本连续多轮服务并担任下一轮独家融资财务顾问。

行云成立于2024年,专注面向大模型推理的新一代GPGPU芯片。技术上打造超大显存规格、极致CUDA兼容的全自研产品,公司目标直指AI大模型推理的普惠化。

创始人季宇博士,清华大学计算机系博士,"华为天才少年"计划成员,曾在华为海思深度参与昇腾AI芯片的编译器与架构研发。CTO余洪敏博士,中科院半导体所博士,曾深度参与包括两款国产AI芯片在内的多款芯片的研发与量产,拥有十余款芯片成功流片经验。一位是站在算法×编译器交界处的架构师,一位是十余次走完"实验室到量产"全流程的芯片老兵——这恰好对应了行云技术路线的两个重点:架构判断要不要赌错、工程交付能不能扛住。

行云的技术路径,可以拆成"介质替换"和"系统级工程"两层。

介质层面,行云放弃成本高昂的HBM,转而采用LPDDR乃至NAND(SSD颗粒)作为显存介质,使显存成本下降1到2个数量级。低成本介质单颗粒带宽较低,行云用多颗粒、多通道并行架构把整体带宽堆叠到TB级,匹配大模型推理的吞吐需求。

系统层面,公司通过Prefill / Decode分离(PD分离)、KV Cache稀疏化、分布式扩展、极致CUDA兼容等手段,在系统级构建软硬件协同壁垒。CTO余洪敏强调,行云的设计优先级已经从"追求单芯片极致性能"转向"从板级系统角度追求可扩展性与供应链稳定性"——通过分布式设计与成熟工艺、低成本存储的组合,在系统层面实现成本最优与体验一致。

物化到产品,就是行云即将推出的首款消费级桌面计算产品,CUDA极致兼容,面向消费级价位点设计。它不是一张被裁剪过的计算卡,而是从底层就为"在端侧跑千亿模型"重新设计的芯片,让用户可以在万元价位高吞吐运行万亿级别参数的大模型。

行云援引一个产业类比:当19世纪的交通革命中铁路刚出现的时候,英国产生了巨大的铁路泡沫,认为所有的道路将通过铁路流通,并最终留下了商业模型的崩溃出清。但最后并不是只靠贯穿大洲的铁路干线完成所有的交通需求,更依赖于深入毛细血管的汽车与公路。今天的AI算力网络也站在同样的分岔口——是走向超算垄断的"中心化铁轨",还是走向端侧普惠的"分布式公路"?

行云给出的答案是后者。在公司的产品路线里,首颗芯片只是第一个锚点。当技术路径进一步推向NAND介质,端侧算力设备的价位有望下探到千元级,覆盖主流千亿乃至万亿参数模型,并在单用户场景下反超云端体验,最终让AI算力设备的普及率接近今天的智能手机。

与此对应,季宇明确表示,公司今年的核心目标是完成芯片量产并尽快推向市场,以芯片产品作为商业化的主要抓手。OpenClaw 和Hermers这类Agent平台的现象级传播也已经印证了下游需求——市场对"消费级硬件承载高质量AI"的渴望,已经具备实际购买力。

峰瑞资本副总裁李罡表示:作为天使轮投资人,行云团队从23年创业开始,对AI芯片,特别是大模型环境下的AI芯片,有着极为前瞻的视角和思路。在近三年模型与应用的快速变化中,我们看到行云针对下一代通用大模型的芯片方案和前瞻设计思想,不断得到验证,始终领先时代半步。

五源资本表示:行云是AI芯片领域少有的"第一性原理"思考者,季宇博士24年就前瞻性地洞察到MoE稀疏架构下硬件瓶颈从算力向显存迁移的结构性转变——放弃HBM、以LPDDR乃至NAND重构显存成本,不是渐进优化,而是通过系统级软硬件协同设计能力推动行业范式创新。2026年以来随着AI模型coding和agent能力持续增强,AI推理需求爆发,OpenClaw 等Agent的现象级破圈,正在把推理算力需求从云端拉向多端、从程序员推向大众,高效低成本的推理能力成为行业刚需。伴随未来推理需求的指数级增长,行云的技术路径将成为推动算力普惠的重要基础设施。

赛富投资基金负责科技赛道的管理合伙人蒋驰华表示在AI大模型向万亿参数演进的过程中,降本的关键已经不在算力,而在显存和系统的架构,特别是在国产算力受限的前提下。季宇和行云团队展现出了罕见的系统级工程视野,他们跳出了盲目堆砌HBM的行业定式,通过LPDDR/NAND等介质替换与并行架构设计,将显存和系统成本打下来一到两个数量级,进而实现单Token成本极值,符合行业演进方向。我们始终聚焦AI与具身智能领域的底层颠覆者。行云兼具前瞻的架构创新与扎实的落地能力,赛富很荣幸能在这一轮重仓支持。

春华资本表示:在国产算力生态加速构建的大背景下,行云敏锐地把设计重心锚定在显存成本重构上,以LPDDR与NAND替代HBM、通过多通道并行架构弥补单颗粒带宽不足,本质上是在重新定义推理芯片的成本架构。季宇博士对AI芯片架构演进方向有着超越行业惯性的深度思考;余洪敏博士作为从海思昇腾到百度昆仑芯一路走来的芯片老兵,对芯片从设计到量产的每一个环节都有实战积累。"敢想"与"能做"的结合,让行云具备了从架构创新到产品交付的完整闭环能力。

佰维存储科技股份有限公司副总经理王灿表示在大模型从通用AI向Agent形态演进的发展阶段,季宇博士展现了极具前瞻性的系统级洞察。他精准识别出:大模型推理的结构性瓶颈已不再仅仅是算力本身,而是制约规模化落地的更低成本的存储。行云的核心逻辑非常清晰——通过介质替换与架构创新,以低成本的LPDDR乃至NAND介质挑战昂贵的HBM霸权,这不仅是物理介质的更迭,更是对大模型推理成本结构的底层重构。在AI Agent爆发的当下,我坚信行云能够真正击穿算力成本,让高质量的万亿级模型实现真正的算力普惠。

【本文根据公开消息发布,如有异议,请联系(editor@zero2ipo.com.cn)投资界处理。】