①Transformer架构驱动了新一轮通用人工智能技术革命,大规模的模型训练与推理对云计算的软硬件体系带来了前所未有的挑战与机遇; ②中国的云计算厂商在从千卡集群、万卡集群到十万卡集群的研发建设能力上,始终与世界顶尖企业齐头并进。
《科创板日报》12月5日讯 根据“深圳工信”公众号今日消息,《深圳市算力基础设施高质量发展行动计划(2024-2025)》于日前印发。其中提到,到2025年,全市基本形成空间布局科学合理,规模体量与极速先锋城市建设需求相匹配,计算力、运载力、存储力及应用赋能等方面与数字经济高质量发展相适应,绿色低碳和自主可控水平显著提升的先进算力基础设施布局,构建通用、智能、超算和边缘计算协同发展的多元算力供给体系,打造“多元供给、强算赋能、泛在连接、安全融通”的中国算网城市标杆。
基本形成算力多元泛在、存力安全可靠、运力优质互联、算存运协同建设的算力基础设施技术体系。
存力方面,本次《计划》提出了具体的定量目标——到2025年,存储总量达到90EB。先进存储容量占比达到30%以上,重点行业核心数据、重要数据灾备覆盖率达到100%。
落实到具体举措上,《计划》则从现金存储技术、热温冷数据分类分级标准体系、关键行业数据容灾备份三方面入手。
其中在先进存储技术中,《计划》提出,鼓励存算并举,规划建设与计算相匹配的存储体系。加速全闪存、蓝光存储、硬件高密等技术部署,构建基于先进存储的存力基础设施。推动存储系统间数据流动能力建设,通过合理的存储分级分层,实现存储资源的高效管理和利用。
值得注意的是,10月初工信部等六部门联合印发《算力基础设施高质量发展行动计划》中,也已强调存力发展:到2025年存储总量需超过1800EB,其中先进存储容量占比超过30%,重点行业核心数据、重要数据灾备覆盖率达到100%。
在具体存力技术上,其提出围绕全闪存、蓝光存储、硬件高密、数据缩减、编码算法、芯片卸载、多协议数据互通等技术,推动先进存储创新发展。
▌存力已成竞争焦点之一
如今存力对算力的重要性愈发凸显,可以说,存力已成为算力的竞争焦点之一。
英伟达11月发布的最新AI芯片H200,其与H100算力基本相当,但性能却大幅提升60%-90%,关键便在于存力的大幅提升——H100内存容量为80GB,带宽为3.35TB/s;H200则是全球首款搭载HBM3e的GPU,内存容量高达141GB,带宽为4.8TB/s,内存配置明显提升。
总体而言,AI服务器用到的主要存储器包括CPU内存、GPU显存和硬盘NAND等,存储器容量和价值量均较普通服务器有数倍提升。据招商证券数据显示:
1)DRAM:总内存容量相较普通服务器有4-8倍的提升,仅CPU内存价值量预计有5倍的提升,GPU的HBM则为纯增量市场;同时最先进的AI服务器已搭配DDR5或LPDDR5;
2)NAND:AI服务器的硬盘容量较传统服务器提升2-4倍,另外传统服务器同时使用机械硬盘和SSD,但AI服务器基本全部使用SSD,整体价值量较普通服务器预计提升10倍左右。
而六部门联合印发的《算力基础设施高质量发展行动计划》,以及深圳市发布的《深圳市算力基础设施高质量发展行动计划(2024-2025)》,也为算力基建中的存力发展指出了更为明晰的方向。
据《科创板日报》不完全统计,A股中先进存储相关厂商包括: