华为昇腾、寒武纪、海光信息适配DeepSeek最新模型

①9月29日，深度求索公司发布新一代大语言模型DeepSeek-V3.2-Exp，并开源于HuggingFace平台，采用稀疏Attention架构提升效率； ②华为昇腾、寒武纪、海光信息均宣布适配该模型。

财联社9月30日讯，9月29日，深度求索公司正式发布新一代大语言模型DeepSeek-V3.2-Exp，并于HuggingFace平台同步开源，模型引入稀疏 Attention 架构，这种架构能够降低计算资源消耗并提升模型推理效率。

随后，华为昇腾、寒武纪、海光信息均同步宣布完成适配，其中昇腾实现0day支持并开源推理代码，寒武纪完成适配且开源推理引擎，海光信息达成无缝适配与深度调优，共同以软硬件协同助力国产AI生态发展。

据“华为计算”微信公众号消息，昇腾已快速基于vLLM/SGLang等推理框架完成适配部署，实现DeepSeek-V3.2-Exp 0day支持，并面向开发者开源所有推理代码和算子实现。

寒武纪在官方微信号宣布，已同步实现对深度求索公司最新模型DeepSeek-V3.2-Exp的适配，并开源大模型推理引擎vLLM-MLU源代码。依托DeepSeek-V3.2-Exp带来的全新DeepSeek Sparse Attention机制，叠加寒武纪的极致计算效率，可大幅降低长序列场景下的训推成本。

海光信息同日宣布其DCU实现无缝适配+深度调优，做到大模型算力“零等待”部署。海光信息表示，基于GPGPU架构强大的生态优势，与编程开发软件栈DTK的特性，DeepSeek-V3.2-Exp在海光DCU上展现出优异的性能，同时验证海光DCU高通用性、高生态兼容度及自主可控的技术优势。

①DeepSeek发布声明，回应用户关于输入“”等特殊字符后模型返回异常内容的疑虑。
                                    ②经技术团队排查，此现象属于特殊字符引发的模型幻觉，不涉及安全问题或隐私泄露。

①中国信通院启动DeepSeek V4国产化适配测试，推动国产AI软硬件深度协同优化；
                                    ②测试覆盖DeepSeek V4全系列模型，聚焦推理、微调等流程，从适配易用性、功能完备性等维度评估。