①12月1日,DeepSeek发布两个正式版模型:DeepSeek-V3.2 和 DeepSeek-V3.2-Speciale。 ②机构指出,DeepSeek推动中国算力生态协同创新与演进,推动中国算力生态的成长。
①9月29日,深度求索公司发布新一代大语言模型DeepSeek-V3.2-Exp,并开源于HuggingFace平台,采用稀疏Attention架构提升效率; ②华为昇腾、寒武纪、海光信息均宣布适配该模型。
①DeepSeek-V3.2-Exp模型正式在Hugging Face平台发布并开源。 ②DeepSeek-V3.2最大的意义在于软硬协同设计支持国产算力,全新DeepSeek Sparse Attention机制,叠加国产芯片的计算效率,可大幅降低长序列场景下的训推成本。