经过一年多的铺垫,字节跳动在AI硬件软件统一的版图上,终于显现出清晰的轮廓。通过豆包大模型,统一智能终端入口。
豆包不再是单一硬件上的独立App,而是有可能成为一个跨应用、跨场景的“超级助手”,甚至是未来终端设备上的AI操作系统。
12月1日,字节和中兴手机合作推出的豆包手机预订版,引起广泛传播。这个消息触动的点在于,以前人们对AI助手设想的*形态,终于走进了现实。
用户可直接通过豆包助手,实现跨平台购物、比价,像人一样完成点击、跳转、填写等复杂链路,真正意义上实现“让AI操作手机”。
当黑科技走进现实,通常会引起人们情感上的不适。网友们甚至跑到豆包的官方账号纷纷留言,豆包给我下楼取快递,豆包现在去喂猫,豆包去银行转100万到我的账户。还有网友忧虑AI执行能力上单线思维,会导致推送错误信息,有网友甚至担心起了电诈会不会更容易。
这也是去年字节开始大力探索豆包大模型和硬件融合以来,首次掀起舆论上的大量讨论。过去几年来,字节在AI硬件道路上持续探索,从智能灯、VR头显、智能耳机,到如今火出圈的AI眼镜,以及与主流的电动汽车合作。
可以说,字节利用豆包大模型,试图包圆所有硬件入口。这种不愿错过下一个硬件入口的野心,都被豆包扛下了。
1、轻量版的华为合作模式
和传统的手机,比如苹果、三星、小米等依托自研硬件与OS推进的AI原生路线不同,字节和中兴手机合作模式,还开创了一种类似车企与华为鸿蒙智行的合作模式。
字节提供的是系统级AI能力,中兴负责硬件与系统框架,两者共同构成一种“软硬协作”的新型分工模式。
在字节的官方介绍里,豆包手机助手,不只是在手机端提供一款豆包APP应用,而是基于豆包大模型的能力和手机厂商的授权,双方在操作系统层面合作。
这意味着豆包手机助手,可以日常交互,也可以调用系统权限,操作UI,控制应用,像人一样操作手机完成各种复杂任务。
但与鸿蒙智行不同的是,字节并未掌控系统底座,而是以AI代理的形式深度嵌入安卓体系。这更像是“轻量版的华为模式”。
这种模式并非字节*。2024年就宣布Apple Intelligence日程计划的苹果,在计划接连跳票后,选择折中办法,开始尝试和第三方模型厂商合作。
此前苹果在中国宣布和阿里的通义千问、百度的文心一言合作,来实现内容合规。在美国,苹果已经把OpenAI最新的GPT-5模型,整合到iOS 26、iPadOS 26和MacOS 26中。而没有AI自研模型的三星,也开始尝试和的谷歌的Gemini合作。
模型厂商和手机厂商合作的真正难题在于,端侧大模型的软硬件协同。把原来云端运行的大模型放到终端,既要发挥芯片的算力,也要兼顾效率,确保大模型的推理能力、智能体能力稳定快速运营。
我们了解到,为了做豆包智能手机,字节还从华为挖来一批专门做AI软件适配的人才。这种手机厂商和大模型厂商深度合作的方式,被视为当下新一代手机AI落地的主流路径。
不过,国内主流手机厂商普遍将AI视作未来生态和商业模式的核心,不愿意让渡操作系统的主导权,小米手机、OPPO、华为手机都在自研模型。
据晚点此前报道,这种合作模式推进起来并不顺利。起初字节接触的所有手机厂商几乎都拒绝合作,主流厂商更想要自研或对AI有*的掌控力。
字节对外表示,豆包正在与多家厂商洽谈合作,未来不排除更多伙伴加入,但目前公开宣布的系统级合作只有中兴手机。
从市场份额来看,中兴并非国内AI手机市场的主流参与者。根据 Canalys 数据,中国市场的AI手机份额主要由苹果、小米、vivo、OPPO、荣耀等厂商占据,中兴并未进入主要统计范围。
这种局面,某种程度上也与华为在汽车领域早期的经历相似。华为当初首次推出鸿蒙智行的智驾方案时,合作对象也是市场占比不高的赛力斯,而后才逐步扩展至更多车企。
不排除字节与中兴之间的合作,是在智能终端战略上的打样,借此吸引更多的厂商合作。
2、字节几乎包圆了硬件设备
字节探索大模型和硬件深度融合道路始于去年,除了手机,耳机、AI眼镜、VR眼镜、汽车、具身智能等硬件领域,都有字节的布局。几乎包圆了。
去年10月,字节推出的智能耳机Ola Friend,是字节在大模型和硬件上深度融合的初次尝试。尽管耳机的软硬件适配难度要小很多,不涉及复杂权限链条,但是跟手机相似,豆包大模型是作为AI硬件设备的“灵魂”,相当于控制了交互入口。
和智能耳机、AI眼镜、手机等主打“操作系统”合作方式不同,字节和车企的合作方式,目前相对浅一些。
早在去年12月的火山引擎大会上,字节相关方面对外透露,豆包大模型已经与八成主流汽车品牌合作。
据我们不完全统计,自从去年8月和smart首次合作以来,豆包大模型已经接入上汽集团、奔驰中国、特斯拉中国、赛力斯等多家车企。但豆包大模型大多扮演的主要角色,是单点AI能力或者AI助理。
今年8月特斯拉中国官宣,将接入豆包大模型。这一合作仅仅局限于豆包语音模型的语音命令功能,如打开导航、播放音乐、调节温度,以及查询车主手册等比较传统的命令方式。
而在AI对话式功能上,比如帮我搜寻附近的加油站,这类更轻松、偏向生成式能力的功能,调用的则是字节火山引擎上的DeepSeek。
有些车企合作方式了,是在上述API之上更进一步。字节参与交互逻辑的搭建,但是汽车厂商通常不会使用豆包命名,而是采用自有品牌。这种合作模式虽然比API更深度,但不触及操作系统层面。
字节想要像手机一样,让豆包大模型的能力触及汽车的操作系统,将车机的语音入口、搜索入口和场景入口都可以调用豆包,目前来说还有点困难。
不过,字节和硬件厂商合作背后,也有自己更深层的考量。这种来自终端设备的融合,可以增加豆包大模型的调用量,形成生态上的优势。
同样是在去年12月火山引擎大会上,字节对外透露,豆包大模型覆盖终端设备约3亿台,来自智能终端的豆包大模型调用量,在半年时间内增长100倍。到今年10月,这个数据上升到4.6亿台。
尽管字节和中兴手机的合作开了个好头,但摆在面前难题是,如何突破主流硬件厂商对其能力的忌惮。仅仅官宣不做硬件的承诺,并不能消除他们的疑虑。
【本文由投资界合作伙伴微信公众号:白鲸实验室授权发布,本平台仅提供信息存储服务。】如有任何疑问,请联系(editor@zero2ipo.com.cn)投资界处理。
旗下微信矩阵:












