春节后,OpenAI携全新视频大模型Sora席卷全球科技圈,也引爆了资本市场的热情。海外,OpenAI估值随着Sora的发布飙升至约800亿美元;国内,A股AIGC概念股纷纷走高,AIGC软件A股上市公司万兴科技(300624.SZ)、当虹科技(688039.SH)、因赛集团(300781.SZ)等在节后*交易日即直冲涨停。目前,Sora概念的热度仍在延续。
作为OpenAI继ChatGPT后的又一个“王炸”,Sora的爆红路径与ChatGPT如出一辙,即凭借惊艳的效果颠覆现有行业水准,引发外界的广泛关注。Sora采用Diffusion transformer模型,将AI生成视频的时长提升到长达1分钟,Runway、Pika等AI视频模型仅能生成10多秒。此外,Sora还展现出“世界模型”特征,能让机器像人类一样,对世界产生全面而准确的认知,大幅提升AI生成视频的逼真度。
Sora的出现,预示着一个全新的视觉叙事时代的到来。当前,视频化内容已成为现代人获取信息的主流方式,截至2023年末,仅国内短视频用户规模已突破10亿人,视频生成赛道前景广阔。国投证券研报指出,Sora有望引领AI新一轮景气度,产业链投资价值持续显现。
随着Sora成为全球焦点,国内市场上,万兴科技、美图公司等Sora概念稀缺标的也备受关注,其在垂直大模型、专业数据壁垒、落地应用方面的稀缺性价值有望受到广泛认可。
稀缺性之一:深耕垂直大模型的决心
经历了2023年的大模型狂飙突进后,行业逐渐树立起一个市场共识:相比通用大模型,垂直大模型更具有落地应用优势。
360创始人周鸿祎曾表示,垂直大模型才是未来的发展方向。美图公司创始人吴欣鸿也认为,垂直大模型+应用场景+商业模式是大趋势。纵观全行业,持续已久的“百模大战”背后,垂直领域的行业大模型已成为布局的重点,并在政务、公共安全、医疗、金融、健康、制造业等领域陆续落地。
而在万兴科技董事长吴太兵看来,大模型正从图文1.0时代,加速进入到以音视频多媒体为载体的2.0时代,垂直大模型好比“工匠”,可更快速、更灵活解决细分领域专业性问题。
目前,万兴科技、美图等行业领军企业已充分结合自身业务优势,推出了各具特色的垂直大模型,加速推动大模型技术朝着更加精细化、实用化和产业化的方向迅猛发展。例如美图公司推出的AI视觉大模型MiracleVision(奇想智能),可实现多种图像类型和视频效果生成。
万兴科技推出的万兴“天幕”大模型则是国内*音视频多媒体大模型,以音视频生成式AI技术为基础,具有“多媒体”“垂直解决方案”“本土化数据”三大特点,让大模型应用落地更有针对性、更具实效。
(由万兴“天幕”大模型生成的AI短片截图)
值得注意的是,Sora尽管也面向视频生成领域,但与万兴“天幕”还存在明显差异。Sora是基于视觉数据的底层通用模型,核心能力是文生视频,偏向影视公司或专业机构;万兴“天幕”则是音视频多媒体创作垂类大模型,涵盖多种大模型能力,文生视频是其中之一,面向的是泛知识、泛营销和泛娱乐等更细分的市场。
在当下的大模型领域中,以音视频为主的多媒体大模型可谓是行业稀缺品,也是当下以语言、图文能力为主的通用大模型难以有效触达的领域。从传统的视频制作流程来看,不仅包含了动画、字幕、音乐、*、美化、转场、粒子、画中画等诸多复杂能力和元素,还有制作流程之外的内容构思、资源获取、效果调试等,这些要素对通用大模型在专业数据等方面的积累来说,是一个不小的挑战。
稀缺性二:海量专业数据的高壁垒
数字经济时代,数据无疑是最宝贵的资产。垂直大模型所需的特定领域核心数据有着极高的壁垒,既无法轻易在搜索引擎中搜到,也难以通过购买获得,唯有依靠长期、持续的积累。换言之,只有长期深耕细分领域的公司才能获得全面真实深度有效的数据。
数据的量是首要问题,垂直大模型通常针对特定的领域或行业进行训练,因此需要收集该领域或行业的海量相关数据。以音视频大模型为例,所需的数据包括文本、图像、音频、视频等多种形式,涵盖视频创作的各种场景和主题,对厂商在音视频领域的数据积累提出了超高要求。
以推出万兴“天幕”的万兴科技来说,在数字创意软件领域航行20年,并持续深耕以视频创意为主的数字创意软件主航道,在全球200多个国家和地区拥有超15亿用户。公开信息显示,万兴“天幕”的推出,正是基于15亿用户行为及100亿本土化高质量音视频数据沉淀,从而实现以音视频生成式AI技术为基础,打造AIGC应用基础底座,提供音视频创作闭环解决方案。
此外,数据的质在垂直大模型训练中同样重要。对于垂直大模型而言,所需的数据往往具有高度的专业性,数据精准度要求高,需要充足的算力对大量数据进行训练和推理,提高模型的准确性。
在这一方面,万兴科技、美图等大模型厂商的投入不遗余力。万兴“天幕”打造NPU+GPU强力算力底座,已构建千卡集群、自研推理框架、进行全球多活架构布局,并拥有一站式数据生产管理平台,单日可完成百万级数据处理加工;技术人才层面,万兴“天幕”组建百人国际化算法团队,并有乌镇智库理事长、中国人工智能最高奖吴文俊奖获得者张晓东等人工智能专家团坐阵,同时还与马投算力及华为云达成三方算力合作,与中广天择达成数据合作。
再看美图,旗下奇想智能大模型也离不开美图在用户创作方面的数据积累。截至2023年上半年,美图月活跃用户总数为2.47亿,美图十余年在影像产品方向深耕为美图带来大量私有数据积累。
通过不断的技术突破和积累,万兴科技、美图等企业正推动着垂直大模型技术向更高的准确性和更广泛的应用领域迈进。
稀缺性三:应用落地前景明确
大模型技术的发展不仅仅是技术层面的突破,更重要的是如何让这些技术从单纯的“炫技”走进广泛的实用阶段,解决真实世界的问题,实现产业价值和社会价值。
从国外视角来看,如今OpenAI的GPT大模型已用于生成代码、文本创作等多种场景,谷歌推出的CoCa正落地客户服务、教育、医疗、工业制造等领域,开始应用基于AI Agent的智能客服系统、教学助手、诊断辅助工具、自动化生产线决策支持系统等产品。国内企业也在加速通用大模型的应用,金山办公的“WPS AI”,飞书的“My AI”,钉钉的斜杠“/”,都是目前较为成熟的落地案例。
然而,在视频模型应用层面,从全球范围来看还处于起步阶段。目前,OpenAI还未对公众开放Sora的测试权限,也尚未赋能任何企业推出AI视频生成的功能或产品;Runway在应用层面最著名的案例还是在电影《瞬息全宇宙》中的应用,更偏向于影视工业合作;前段时间爆火的Pika在应用落地层面同样进展缓慢。
反观国内,不少公司在视频模型应用上早已抢跑。美图公司推出的AI视觉大模型MiracleVision 4.0版本,在AI视频方面具备文生视频、图生视频、视频运镜、视频生视频四大能力,并宣称已能融入电商、广告等行业工作流。
万兴科技在视频模型应用探索的道路上走得更远,一方面,通过在成熟的视频创作场景中引入AI技术,重构创作流程,另一方面,运用AI技术推出创意新品,为视频模型的“着陆”提供更多实际场景。
例如,万兴科技此前发布的视频剪辑软件Wondershare Filmora 13全新版本,利用天幕大模型能力落地了AI Copilot智能剪辑助手、AI文字快剪、AIGC音乐生成等功能,从去年8月份至12月底,使用AI功能的用户数增加了243%。此外,万兴科推出了AIGC“真人”营销视频创作神器“万兴播爆”,并应用万兴“天幕”大模型数字人能力,使AIGC更好地服务于出海视频创作者。
随着Sora等模型的出现和成熟,也为国内的视频生成模型指出了可行路径,通过借鉴Sora的技术方案、训练方案等,能让国内的大模型发展速度更快,进而在解决垂类用户的问题方面产生更大的价值。万兴科技是国内首批接入微软Azure OpenAI商用服务权限企业,旗下海外主要产品已接入Azure OpenAI服务。作为微软全球创新的主要合作伙伴,万兴科技还将享有微软新产品的优先测试、使用权益。
回首一年前,ChatGPT横空出世为文本创作领域带来重大变革,如今,Sora的到来令AI视频生成赛道迎来新的“GPT时刻”,大模型的升维竞赛也正如火如荼地展开,在国内企业突破AI视频生成技术的征途中,三大稀缺价值重要性将日益凸显。