DeepSeek更新GitHub仓库新模型“MODEL1”曝光

《科创板日报》21日讯，北京时间1月21日，DeepSeek官方GitHub仓库更新deepseek-ai/FlashMLA，借助AI对全部总代码文件数:114个（包括.py, .md, .txt, .sh, .cpp, .cu, .h文件）进行分析，发现了一个此前未公开的模型架构标识“MODEL1”，共被提及31次。MODEL1是DeepSeek FlashMLA中支持的两个主要模型架构之一，另一个是DeepSeek-V3.2。据推测，MODEL1很可能是一个高效推理模型，相比V3.2，内存占用更低，适合边缘设备或成本敏感场景。它也可能是一个长序列专家，针对16K+序列优化，适合文档理解、代码分析等长上下文任务。 (腾讯科技)

①特斯拉首席执行官埃隆·马斯克宣布重启超级计算机项目Dojo 3，该项目曾被搁置五个月，核心使命转向“太空人工智能（AI）计算”；
                                    ②马斯克认为未来四到五年内，在轨道上运行大规模人工智能系统将比在地球上运行更具成本效益。

①随着数据中心相关支出持续推高存储解决方案需求，周二，美股存储芯片板块大幅上涨，其中闪迪领涨；
                                    ②闪迪股价周二大涨近10%，创下历史新高，使其今年迄今的涨幅达到约90%；
                                    ③花旗集团一口气上调了对多家存储芯片公司的目标价，其中对闪迪目标价的上调幅度最大。