财联社
财经通讯社
打开APP
10:42:07【DeepSeek更新GitHub仓库 新模型“MODEL1”曝光】
《科创板日报》21日讯,北京时间1月21日,DeepSeek官方GitHub仓库更新deepseek-ai/FlashMLA,借助AI对全部总代码文件数:114个(包括.py, .md, .txt, .sh, .cpp, .cu, .h文件)进行分析,发现了一个此前未公开的模型架构标识“MODEL1”,共被提及31次。MODEL1是DeepSeek FlashMLA中支持的两个主要模型架构之一,另一个是DeepSeek-V3.2。据推测,MODEL1很可能是一个高效推理模型,相比V3.2,内存占用更低,适合边缘设备或成本敏感场景。它也可能是一个长序列专家,针对16K+序列优化,适合文档理解、代码分析等长上下文任务。 (腾讯科技)
人工智能
财联社声明:文章内容仅供参考,不构成投资建议。投资者据此操作,风险自担。
R1模型发布一周年 DeepSeek新模型“MODEL1”曝光
2026-01-21 10:42:07 433821 阅读
商务合作
热门解锁
相关阅读
评论
热度
最新
发送
复制
取消
垃圾广告
政治激进内容
色情低俗内容
取消