财联社
财经通讯社
打开APP
11:24:40【蚂蚁集团开源发布全模态大模型 Ming-Flash-Omni 2.0】
蚂蚁集团开源发布全模态大模型 Ming-Flash-Omni 2.0,是业界首个全场景音频统一生成模型,可在同一条音轨中同时生成语音、环境音效与音乐。用户用自然语言下指令,可对音色、语速、语调、音量、情绪与方言等进行控制。模型在推理阶段实现了 3.1Hz 的极低推理帧率,实现了分钟级长音频的实时高保真生成。(记者 黄心怡)
蚂蚁集团 人工智能 TMT行业观察
财联社声明:文章内容仅供参考,不构成投资建议。投资者据此操作,风险自担。
2026-02-11 11:24:40 736009 阅读
商务合作
热门解锁
相关阅读
评论
热度
最新
发送
复制
取消
垃圾广告
政治激进内容
色情低俗内容
取消