北京新闻喙金融(Wei Yingzi Reporter)是一名北京新闻喙财务记者,他从Kuaishou那里得知Keling AI最近发起了数字人类功能,该功能于9月18日承认了一分钟的视频,目前正在为Beta Public开放其产品。 Kuahou说,Keling AI Digital可以通过高度对齐的交叉衰减机制来实现音频形状和嘴唇的同步,并通过改进的音频和视频,以嘴唇的形式进行培训策略以及精致的数据处理。借助关键的框架控制体系结构,模型可以首先建立一个高级的叙事骨架,然后并行生成多个数字人类视频的剪辑,从而实现特定长度的视频,同时保持身份的一致性。 Kering AI数字人类功能页面。公司提供的照片。 Beike Finance报告测试了Keling AI Digital People的唇部同步功能,该功能具有中文,英语和韩国歌曲,分别。在同一8秒的视频中,此功能识别出比英语和韩国歌曲更好的中文歌曲。英语和韩国歌曲中的单个单词仍然不符合数字人物嘴唇的同步。 Yang Juanjuan编辑审查Liu Baoqing