①阿里千问大模型核心负责人林俊旸在社交媒体突然发文称将卸任。阿里云相关人士称,“暂时没有”回应。
②有报道称,通义实验室拟把Qwen模型团队拆开、打散的组织变化,不符合林俊旸对技术趋势的判断。他曾多次表示,预训练、后训练,乃至 Infra 和训练团队应该更紧密地结合和沟通。
财联社9月18日讯,9月17日,由DeepSeek团队共同完成、梁文锋担任通讯作者的DeepSeek-R1推理模型研究论文,登上了国际权威期刊《自然》的封面。


与今年1月发布的DeepSeek-R1的初版论文相比,本次论文披露了更多模型训练的细节,并正面回应了模型发布之初的蒸馏质疑。DeepSeek-R1也是全球首个经过同行评审的主流大语言模型。Nature评价道:目前几乎所有主流的大模型都还没有经过独立同行评审,这一空白“终于被DeepSeek打破”。