搜狗人工智能技术再次迎来突破,世界首个3D人工智能合成锚发布
浏览:198 时间:2023-5-7

5月21日,在全国人民代表大会召开之际,由搜狗和新华社联合推出的世界首个3D人工智能合成主播“新肖伟”正式亮相,将全国人民代表大会的最新新闻和信息报道带给全国观众。基于搜狗人工智能核心技术“搜狗的化身”的“新小微”,将开启中国传媒业全面进入智能时代。搜狗在头像技术上取得了又一次突破,作为人工智能复合锚的先驱和领导者,引领人工智能复合锚进入了3D时代。自2018年推出全球首款基于搜狗头像技术的人工智能复合主播以来,搜狗头像不断取得重大突破,这款3D人工智能复合主播是搜狗头像的最新突破成果。《新》以新华社记者赵为原型,基于超逼真3D数字人体建模、多模态识别与生成、实时人脸运动生成与驱动、迁移学习等多种人工智能前沿技术,使机器能够基于输入文本生成高保真3D数字人体视频内容。3D人工智能合成锚结合了行业领先的扫描和修复、面部肌肉驱动、表情肢体捕捉和力技术提供的其他技术,以产生高度恢复真实人类毛发和生动图像的数字人类模型;同时,基于搜狗领先的端到端多模态建模技术,利用语音、图像、文本和三维肌肉运动数据等多模态信息完成关节建模训练。在人工智能算法的驱动下,“新瓦威”只需输入文本内容,就可以根据语义实时播报新闻,其面部表情、嘴唇动作、身体动作和声音表情高度一致,自然逼真。从2D到3D,搜狗人工智能继续引领媒体应用的创新。搜狗推出全球首款人工智能合成主播后,人工智能合成主播通过不断的迭代更新,具备了多语种播放、对话和互动等多种功能,并以尖端的技术能力和产品效果不断推动媒体行业内容制作的效率变革。据统计,第一位人工智能合成主持人“新小昊”在新华社的客户端已经为观众服务了500多天,制作了13000多条新闻报道,累计时长超过35000分钟。与之前的2D人工智能复合锚相比,3D“新娃娃脸”不仅具有立体感、灵活性和可控性,还具有支持多摄像机、多景深、360°任意角度呈现内容的能力。它在应用空间上有更多的可能性,为新闻节目的多样化制作和呈现带来更多的选择。在5G时代,搜狗阿凡达技术的应用将从最初的2D爆炸到今天的3D人工智能合成锚,而在它的背后不仅仅是搜狗阿凡达技术一次又一次