阿里开源全模态大模型Qwen3-Omni 可像人类一样听说写

财联社9月24日电，阿里巴巴发布通义全模态预训练大模型Qwen3-Omni系列模型。在36个音视频基准测试中，Qwen3-Omni系列模型有22项达到SOTA水平，其中32项取得开源模型最佳效果，语音识别、音频理解与语音对话能力可比肩Gemini2.5-Pro。作为全模态模型，Qwen3-Omni能够实现全模态输入和全模态输出。类似于人类婴儿一出生就全方位感知世界，Qwen3-Omni一开始就加入了“听”“说”“写”多模态混合训练。在预训练过程中，Qwen3-Omni采用混合单模态和跨模态数据。Qwen3-Omni在实现强劲音频与音视频能力的同时，单模态文本与图像性能均保持稳定，这是业内首次实现这一训练效果。

①第一，通义千问坚定开源开放路线，致力于打造“AI时代的Android”；其二，构建作为“下一代计算机”的超级AI云，为全球提供智能算力网络。
                                    ②阿里正在积极推进三年3800亿的AI基础设施建设计划，并将会持续追加更大的投入。2032年阿里云全球数据中心的能耗规模将提升10倍。

①华尔街明星基金经理、方舟投资掌门人凯茜•伍德周一对其管理的投资组合进行了几项引人注目的调整；
                                    ②方舟投资旗下ETF向中概股投资了约2100万美元，涉及的股票包括阿里巴巴集团、百度和小马智行等中国科技股。