小米开源首个原生端到端语音大模型

财联社9月19日电，小米正式开源首个原生端到端语音模型——Xiaomi-MiMo-Audio，它基于创新预训练架构和上亿小时训练数据，首次在语音领域实现基于ICL的少样本泛化，并在预训练观察到明显的“涌现”行为。据介绍，在通用语音理解及对话等多项标准评测基准中，MiMo-Audio大幅超越了同参数量的开源模型，取得7B最佳性能；在音频理解基准MMAU的标准测试集上，MiMo-Audio超过Google闭源语音模型Gemini-2.5-Flash；在面向音频复杂推理的基准Big Bench Audio S2T任务中，MiMo-Audio同样超越了OpenAI闭源的语音模型GPT-4o-Audio-Preview。

①Meta首席执行官扎克伯格表示，尽管存在人工智能泡沫的风险，公司仍将投入大量资金以抓住人工智能机遇；
                                    ②扎克伯格认为，Meta面临更大风险在于犹豫不决，而非过于激进，该公司计划2028年前在美国投入至少6000亿美元；
                                    ③扎克伯格还称Meta正为超级智能做准备。

①《通知》提出，到2030年实现“百城万圈”目标，即确定100个一刻钟便民生活圈全域推进先行区试点城市，建成1万个便民生活圈；
                                    ②《通知》强调“问需于民、问计于民”“因城施策、一圈一策”“缺什么、补什么”的原则，聚焦群众急难愁盼，突出“一老一小”，推动便民生活圈建设扩围升级。