8月24日,2023浪潮信息新产品“互联网+AIGC”行业巡展暨大模型智算软件栈OGAI发布会在北京举办。作为浪潮合作伙伴,快手StreamLake深入参与此次大会,快手异构计算负责人刘凌志博士进行了《“芯”驱动:释放智能视频之力 》主题演讲,重点分享了快手SL200芯片的最新进展,介绍了智能视频SOC芯片的典型架构和主要功能,以及基于此芯片搭建的智能视频处理云端基础设施,展示在多种场景所表现的优异性能,并在圆桌论坛环节与嘉宾们探讨了如何与上下游企业进行深度合作。
构建大算力基础设施体系,应对视频和大模型挑战
伴随快手用户、内容、商业生态的快速发展,AI*、AI数字人等应用在快手广泛落地。在AI大模型进入AGI时代的过程中,快手紧跟大模型应用浪潮,在搜广推场景、内容创作、提高研发效能等方面持续深耕大模型领域,并于近期发布了“快意”大语言模型,在 CMMLU 中文向排名中,KwaiYii-13B 同时位列 five-shot 和 zero-shot *。
刘凌志指出,大模型在音视频上的应用更加复杂。根据音视频*性的原理,音视频主要是要解决清晰度、成本和流畅度三个问题,需要在这三者之间做到平衡。在此过程中,处在核心地位的就是视频的压缩和增强。
快手的大模型和视频编解码如何结合?刘凌志表示,在传统生产和消费的过程中,生产端视频首先经过编码器产生码流并传送到消费端,消费端通过解码器把视频解码出视频展示出来。利用大模型来做视频压缩和增强,视频通过理解网络生成出高维特征,并传输Text和Prompt,这是一个非常小的信息量,用户通过生成网络大模型再把视频恢复出来,这样可以极大地减少传输成本,得到更好的效果。
在刘凌志看来,快手在大模型和视频领域面对的挑战归根到底是大算力的挑战,包括视频算力挑战和大模型算力挑战两个方面。
快手又是如何解决这两大挑战中的各类问题?刘凌志表示,快手构建了大规模的基础设施,来支撑主站、电商、商业化、本地生活和海外在内的产品矩阵。快手核心技术包括音视频、AI和数据中心三大类,每一类技术都需要十分庞大的基础设施,比如千万级别的CPU核、10万级别的GPU和算力、10EB级别的数据存储,带宽需求也到了100TB规模。
为此,快手搭建了大模型架构体系。通过AI算力中心、平台、数据等高性能、高并发、高算力的大基建,可以支撑快手多模态大模型,而多模态大模型通过生成或理解,可以支持快手的搜广推、AIGC、增长或研发效能等大应用。
更进一步来看,快手AI大基建的数据已有日均数千万的短视频和数千万小时的直播,一方面是传输给用户,另一方面也是作为输入持续不断的输送到大模型之中,不断打磨大模型,达到更佳的效果。刘凌志强调,“更重要的是,我们在算力中心里面进行了比较深入的开发,这个深入开发最终体现在自研芯片SL200上。”
*智能视频处理芯片,SL200节省30%码率,支持8K应用
作为快手StreamLake*自研智能视频处理芯片,快手SL200芯片具有非常优秀的视频效果。提及该款芯片可以做哪些工作,刘凌志表示,SL200芯片首先是高质量、高密度的编解码器。比如,把快手自研的算法固化到硬件中,作为一个硬件的视频处理引擎;高质量的编码器在同样的质量下,可以节省30%的码率,在同样的带宽下,可以提升相应的清晰度。依托SL200芯片,不仅自然场景视频能够获得非常好的效果,较难处理的游戏、数字人等场景也会得到非常显著的清晰度的提升。
同时,刘凌志指出,SL200也已实现了智能视频的处理,这在未来视频领域尤其重要,在同样主观质量下,可以继续降低20%以上的带宽。比如把感兴趣的区域找出来,然后对它投入更多的带宽,而对不感兴趣的地方可以降低清晰度以平衡带宽。传统视频的任务,如去模糊、降噪、去视频效应等,除了可以用自己硬件的传统算法来做,也可以用AI获得更好的效果,并且可以二者在流水线上进行叠加获得叠加的效果。SL200芯片在其他智能视频应用中也展示优异性能,比如超分,可以实时的把一个小的幅面放大到4K/8K,或者是大的变小;在视频内容识别和检测应用中,SL200有较高的处理速度,准确率也是比较高的。
据悉,具备高质量、高性能、智能化特点的快手SL200,已达到行业*的压缩效率,客观质量相比X265 medium可以节省30%码率,单卡可以支持8K120帧/秒的处理或者8路4K60帧/秒的处理,内置智能画质处理引擎,支持内容自适应编码。
刘凌志认为,从芯片设计来看,进入到智能视频时代,需要的是一个具有多种功能的SOC芯片。这就要求芯片不仅要有高质量高密度的编解码器,还需要有能够支持实时视频处理的AI引擎。另外,为了支持未来视频算法的迭代,需要有较强的可编程的能力,所以SL200集成了多核GPGPU和高性能多核CPU,RISC-V处理器,以及数据中心里面的功耗检测、温度检测等功能,为了保护用户的隐私也需要内嵌硬件安全模块。
SL200芯片也获得了业内高度认可,在今年7月举办的MSU2022世界编码器大赛中,SL200一举夺得4K和1080P赛道24项指标中的16项*,在全部6个赛道中获得5项“*ASIC编码器”。
刘凌志透露,基于SL200芯片,快手自研了板卡、服务器,也与浪潮等合作开发了云服务器,同时搭建了算力中心,开发了全套自主软硬件的生态系统,已经在快手部署了数万片,并在各大公有云厂商进行测试。快手StreamLake持续通过成熟的技术赋能产业,并与浪潮等生态伙伴深入合作。
活动现场,快手StreamLake还围绕芯片、快手智播等核心产品进行了重点展示,向现场嘉宾展示了产品的广泛应用场景。
据悉,基于浪潮与快手StreamLake的深度合作,双方将在硬件生态等领域携手发展,布局算力未来。刘凌志表示,快手StreamLake希望通过*的技术能力,能够更好地助力各行各业在智能视频新时代、大模型新时代获得成功。