新京报贝壳财经讯(记者韦英姿)9月18日,新京报贝壳财经记者自快手获悉,可灵AI近日已推出数字人功能,最长支持生成1分钟的视频,目前产品公测陆续开放中。快手方面表示,可灵AI数字人通过音画高度对齐的交叉注意力机制、强化口型的训练策略以及精细化的数据处理,能够实现语音与唇形的同步;采用关键帧控制的架构,模型先构建高层次叙事骨架,再并行生成多个片段的数字人视频,可在保持身份一致的前提下,实现一定长度视频生成。


可灵AI数字人功能页面。企业供图


贝壳财经记者分别以中文、英文、韩文歌曲测试了可灵AI数字人的对口型功能,在同一段8秒视频中,该功能识别中文歌的表现相对好于英文、韩文歌,英文、韩文歌中的个别单词与数字人的口型仍无法较好拟合。


编辑 杨娟娟

校对 柳宝庆