财联社
财经通讯社
打开APP
15:01:38【字节跳动提出OmniHuman多模态框架 一张图配上音频即可生成逼真视频】
《科创板日报》6日讯,字节跳动提出了一种名为OmniHuman的端到端多模态数字人视频生成框架,可基于一张图片和运动信号(如音频、视频或两者)生成视频。该框架混合数据训练策略,科技媒体TechSpot称它可能是目前最逼真的深度仿真算法。不过,该框架目前暂未向公众提供服务。
TMT行业观察 字节跳动 人工智能
财联社声明:文章内容仅供参考,不构成投资建议。投资者据此操作,风险自担。
2025-02-06 15:01:38 1676119 阅读
商务合作
专栏
相关阅读
评论
热度
最新
发送