又一大厂入局超节点！百度公布AI芯片路线图后续将推千卡、4000卡超节点

①百度发布了新一代昆仑芯M100和M300。同步发布的天池256超节点与天池512超节点将于明年正式上市。
                ②超节点俨然已经成为了未来数据中心大模型算力平台的标配和方向。但受限于可靠性和配套工具链，目前仍处在小范围试点阶段。

《科创板日报》11月13日讯（记者黄心怡）在今日举行的百度世界大会上，百度发布了新一代昆仑芯M100和M300。

同步发布的天池256超节点与天池512超节点将于明年正式上市，单个天池512超节点就能完成万亿参数模型训练。未来五年昆仑芯都将按年推出新产品，百度智能云还将陆续推出相应的千卡、4000卡超节点。

此外，百度还发布了文心大模型5.0、实时互动型数字人、通用智能体GenFlow 3.0版本等。在AI硬件方面，小度AI眼镜Pro、小度智能摄像机C1200三摄版和C800视频通话版、小度智能音箱Fun等一同亮相，将搭载多模态AI智能助手——超能小度。

魔形智能CEO徐凌杰告诉《科创板日报》记者，超节点俨然已经成为了未来数据中心大模型算力平台的标配和方向。但受限于可靠性和配套工具链，目前仍处在小范围试点阶段。

▍昆仑芯单一集群规模计划扩至百万卡级

这次大会上发布的新一代昆仑芯包括两款产品。其中，昆仑芯M100 针对大规模推理场景优化设计，将于2026年上市；昆仑芯M300面向超大规模的多模态模型的训练和推理任务，预计2027年上市。

会上，百度智能云宣布将不断加大在超节点上的建设，正式发布基于昆仑芯的新一代超节点——天池256和天池512。

相比上一代产品，天池256超节点最高支持256卡极速互联，卡间互联带宽提升4倍、整体性能提升50%；天池512超节点最高支持512卡极速互联，单个超节点即可支撑万亿参数模型训练。两款产品将于明年正式上市。

根据芯片路线图，未来，百度智能云还将陆续推出相应的千卡、4000卡超节点：预计在2028年百度天池千卡级超节点将上市，2029年昆仑芯N系列将上市，2030年百度百舸百万卡昆仑芯单集群将点亮。

昆仑芯和天池超节点路线图

目前，昆仑芯已累计完成数万卡部署。百度在今年已经点亮了昆仑芯三万卡集群，可同时支撑多个千亿参数大模型训练。未来，百度智能云将把昆仑芯单一集群的规模从三万卡进一步扩展至百万卡级别。

▍超节点成为AI基础设施建设新常态

除了百度外，阿里、华为、中兴通讯、中科曙光等都纷纷入局。

11月6日，2025世界互联网大会乌镇峰会期间，中科曙光正式发布全球首个单机柜级640卡超节点scaleX640，采用超高速正交架构、超高密度刀片、浸没相变液冷、高压直流供电等技术。

2025年云栖大会现场，阿里云发布全新一代磐久128超节点AI服务器，由阿里云自主研发设计，可支持多种AI芯片，单柜支持128个AI计算芯片。

华为此前推出了Atlas 900 A3 SuperPoD（CoudMatrix 384超节点），已累计部署300+套，服务20+客户。后续将推出更强的超节点Atlas 950 SuperPoD，支持8192张昇腾卡，算力达8 EFLOPS FP8 / 16 EFLOPS FP4，全光互联带宽16.3PB/s，预计于2026年四季度上市。

此外，华为还规划后续推出超节点产品Atlas 960 SuperPoD ，预计将支持15488张昇腾卡，算力达30 EFLOPS FP8 / 60 EFLOPS FP4，计划2027年四季度上市。

而上海仪电联合曦智科技、壁仞科技、中兴通讯发布了国内首个光互连光交换GPU超节点——光跃LightSphere X。该超节点基于曦智科技全球首创的分布式光交换技术，采用硅光技术的光互连光交换芯片和壁仞科技自主原创架构的大算力通用GPU液冷模组与全新载板互连，并搭载中兴通讯高性能AI国产服务器及仪电智算云平台软件。

对于互联网厂商自研超节点，有芯片业内人士对《科创板日报》表示，这正如OpenAI在采购英伟达芯片的同时，也要自研算力芯片。对于互联网厂商而言，自研芯片和超节点能够实现自主可控，从芯片到芯片间的通信协议都实现自研，可以避免“卡脖子”，但在实际应用中，不一定算力中心全部采用自研芯片。

▍超节点仍处在小范围试点阶段

魔形智能CEO徐凌杰告诉《科创板日报》记者，从去年英伟达发布NVL72超节点，到今年各家厂商陆续发布超节点产品，超节点俨然已经成为了未来数据中心大模型算力平台的标配和方向。超高算力密度的超节点通过把更多的芯片在系统中高速互连，理论上能够显著提升大模型运行的效率，大幅降低总体拥有成本（TCO）,但受限于可靠性和配套工具链，目前仍处在小范围试点阶段。

根据此前媒体报道，目前英伟达NVL72尚未完成大规模训练任务，因其软件尚待成熟且可靠性挑战仍在攻关中。徐凌杰表示，除了性能之外，能把系统的稳定性和可靠性做好成为了检验超节点是否能够大规模商业化落地的试金石。

“现今主流在用的AI芯片，功耗往往不超过700瓦，面向未来的应用场景，单颗AI芯片的功耗会超过1000瓦，通过芯粒（Chiplet）方式多颗封装之后可以高达2000瓦以上，这就对供电、散热等配套设备提出了更高的要求。我国的芯片在国产制程上暂时落后于世界最先进水平，但在系统层面做高密度集成大有可为，通过打造一个强大且团结的供应链产业链，能够带动从AI芯片、CPU、互联芯片，到高端PCB、液冷系统、供电系统和互联介质等多个关键领域，有利于打造一个万亿级别的智算市场。”徐凌杰称。

此外，对于推理业务，超节点异构化的趋势也非常明显。徐凌杰介绍，英伟达在Rubin系列中就用两款不同芯片来分别处理prefill（预填充）和decode（解码）任务。未来的超节点在token成本上要有商业竞争力，对于芯片公司来说，可能不是一款芯片打天下。至少需要2-3款芯片在系统里发挥不同作用，这对规模不大的芯片公司来说是一个不小的成本和研发压力。

①因高调做空AI热门股引发关注的《大空头》原型迈克尔·贝瑞突然宣布Scion基金撤销SEC注册，引发市场震动；
                                    ②贝瑞还公开其Palantir、英伟达期权空单细节，驳斥外界“十亿美元做空”的误读。