字节跳动提出OmniHuman多模态框架一张图配上音频即可生成逼真视频

财联社

财经通讯社

打开APP

15:01:38【字节跳动提出OmniHuman多模态框架一张图配上音频即可生成逼真视频】

《科创板日报》6日讯，字节跳动提出了一种名为OmniHuman的端到端多模态数字人视频生成框架，可基于一张图片和运动信号（如音频、视频或两者）生成视频。该框架混合数据训练策略，科技媒体TechSpot称它可能是目前最逼真的深度仿真算法。不过，该框架目前暂未向公众提供服务。

财联社声明：文章内容仅供参考，不构成投资建议。投资者据此操作，风险自担。

2025-02-06 15:01:38 1676119 阅读

专栏

相关阅读

阿里引进世界级AI科学家加码大模型C端布局

科创板日报记者黄心怡责编毛明江 2025-02-06 15:35

“瓜分”谷歌蛋糕？OpenAI宣布免费开放搜索或成为今年AI应用一大突破

科创板日报记者黄心怡责编毛明江 2025-02-06 13:21

华为全年营收重返8000亿董事长梁华：整体经营达到预期

科创板日报记者黄心怡责编郑远方 2025-02-05 16:25

热度