5月18日,如祺出行旗下数据业务板块(以下简称“如祺数据”)首次向外界完整披露其AI数据资产版图。官方信息显示,该资产已覆盖标注数据、行为数据、合成数据及多模态训练数据集四大类。
如祺出行称,公司基于真实出行场景长期积累的数据,除了支持自动驾驶等行业外,还将支持具身智能、世界模型等面向真实物理世界的AI技术发展。这意味着,这家出行服务平台正加快将其AI数据服务向具身智能、世界模型等高增长领域拓展。
如祺出行AI数据服务近年保持高速增长。2025年,以该业务为主要收入来源的技术服务板块该录得营收1.60亿元,同比大增487.4%,是公司增长最快的业务板块。
当前全球AI产业正经历深刻范式转移,以具身智能为核心应用场景的世界模型被公认为下一个主战场,但相关训练需要数据,正面临百亿小时级数据缺口,且采集成本极高。
如祺出行在真实出行场景积累的数据,天然包含驾驶员行为、道路交互、空间关系、时间序列等深层信息,符合当前AI行业、尤其是世界模型训练最稀缺的优质数据要求。有市场分析观点认为,从此次披露的信息可看出,该公司正加快将包括Robotaxi在内的出行业务积累的数据转化为可对外商业化的数据资产,开辟新的增长曲线,在公司未来发展打开更大的价值成长空间。
聚焦真实出行高价值场景
拥有具身智能训练“黄金数据矿”
物理世界数据正成为AI产业最稀缺、最有价值的战略资产。据艾瑞咨询预测,中国具身智能产业2030年将突破4000亿元,2035年超万亿元。但行业数据显示,可供具身智能背后世界模型训练的高质量数据,目前全球总量仅约50万小时左右,而头部厂商单年需求量即达百万小时级别,供需严重失衡。国泰海通研报明确指出,数据缺口已取代算法,成为具身智能发展的*障碍。
但类似如祺出行这样的出行服务企业,却天然具备成为高质量“黄金数据矿”条件。凭借每年数亿的出行订单规模和庞大的车辆运行数据,如祺出行每一天都在积累海量司机行车、泊车以及高频交通场景的多模态数据。与传统图片、视频又或者人工搭建模拟场景数据相比,这些数据记录了“司机决策-车辆响应-环境反馈”的完整链条,具备因果关联与交互逻辑,尤其适用于训练世界模型和具身智能系统。
官方信息显示,如祺出行在2023年开始布局AI数据解决方案,通过将智驾数据采集车投入常态化运营,同步合规采集真实驾驶及道路数据。截至2026年5月,公司已在广州、上海、重庆、沈阳等城市部署超过300辆智能驾驶数据采集车,每日可产出1600小时、130TB合规数据。
目前具身智能等领域的数据采集普遍存在成本高、周期长、场景有限等痛点,市场分析人士表示,如祺出行这种“一边常态运营、一边合规采集”的模式,会显著降低数据获取边际成本、采集场景丰富,有机会快速形成差异化竞争优势。
“数据集+全栈能力”已获商业化验证
新战略曲线有望打开营收增长空间
不同于传统AI数据服务商多数聚焦于基础标注服务,如祺出行正从单纯的“卖标注”向“数据集+全栈能力”升级,已形成涵盖数据采集、规模化处理、精准标注、合成数据及多模态处理等全链路能力,让公司不仅能服务于智能驾驶的AI模型升级,更能向具身智能等高价值赛道延伸,实现数据服务能力的价值链攀升。
官方信息显示,如祺数据已具备将包括数据集及服务能力在内的整套AI数据服务封装为标准化产品的综合能力。通过“数据即服务”模式,客户可直接获取如祺数据产品开箱即用,无需再投入高昂成本处理底层数据清洗与标注,显著降低使用高质量真实数据的门槛。
目前,如祺出行的AI数据服务已进入智能驾驶、具身智能、大模型、消费电子、医疗等多个领域,客户包括腾讯、小马智行、理想、火山引擎、百度智能云、广汽集团等头部企业。
分析人士指出,如祺出行在AI数据服务方面的能力及商业化落地进度已为公司构成新增长曲线,公司有望在保持出行业务订单量及营收持续增长的同时,进一步打开科技业务的营收增长空间。



