打开APP
×
15:01 字节跳动提出OmniHuman多模态框架 一张图配上音频即可生成逼真视频
《科创板日报》6日讯,字节跳动提出了一种名为OmniHuman的端到端多模态数字人视频生成框架,可基于一张图片和运动信号(如音频、视频或两者)生成视频。该框架混合数据训练策略,科技媒体TechSpot称它可能是目前最逼真的深度仿真算法。不过,该框架目前暂未向公众提供服务。
TMT行业观察 字节跳动 人工智能
阅读 33683
特别声明:文章内容仅供参考,不构成投资建议。投资者据此操作风险自担。
相关企业家
联系Ta
联系企业家
为保护双方个人信息请联系您的专属助理进行接洽
我再想想
点击复制
复制成功,请去微信添加