①国家超级计算太原中心为全栈国产架构,峰值双精度科学算力300PFlops,半精度人工智能算力800PFlops,计算能力处于全国第四; ②太原中心目前构建了人工智能、高端装备、工业仿真、生命科学、生态环境、地球科学六大先进计算平台,服务多个高校、科研院所、科技企业等。
《科创板日报》8月23日讯(记者 张洋洋)在调度中心的大屏幕上,显示着工业仿真先进计算服务平台、生态环境先进计算服务平台、全球区域一体化SD3系统等的运行图,多个图像在不断跃动,每个项目的运行情况尽在眼前。这是在国家先进计算太原中心,《科创板日报》记者看到的一幕。
▍全栈国产的“太行一号”
国家超级计算太原中心由山西省委省政府推动,山西云时代技术有限公司与山西大学共同承建。于2021年3月开工建设,10月通电试运行,2022年4月通过科技部验收并纳入国家超算序列管理,正式投入运营。该项目总投资27.04亿元,建筑面积超1.3万平方米。
据国家超级计算太原中心主任赵崇山介绍,太原中心主机命名“太行一号”,是科技部E级原型机系统架构的落地成果之一,采用全栈国产设备,峰值双精度科学算力300PFlops,半精度人工智能算力800PFlops,存储容量300PB,目前计算能力处于全国第四。
赵崇山告诉《科创板日报》等媒体,太原中心支持主流人工智能开源框架,可适配百度、商汤、华为等商用框架,兼容业内主流人工智能算法模型,支持图像识别、自然语言处理、Al For Science等多种类型的人工智能场景下的主流商用大模型应用。
在硬件架构之外,能效控制成为该中心的一大亮点。该中心采用了全新一代全浸没相变液冷技术,将处理器、主板等在内所有计算部件浸没于液态冷媒中,实现了高密度、全覆盖、无死角、高效恒温冷却,核心计算机房PUE值突破性降至1.04。在相同能耗下,通过这项技术,计算机散热功率能达到传统风冷的25倍,冷却节能90%以上。
值得注意的是,太原中心在建设之初即确立“技术架构一步到位、算力需求分步实施”的策略,避免“重建设、轻使用”的常见问题。算力中心的算力部署并非一次性堆砌,而是根据实际科研与产业需求逐步扩容。
这种思路,也体现在太原中心的生态合作模式上——其已与中科曙光、中科院等机构建立技术协同机制,并参与制定多项高性能计算团体标准,推动国产算力体系的规范化发展。
此外,太原中心已当选国家超算互联网副理事长单位,并联合黄河流域多个算力节点发起成立“黄河流域算网联盟”,探索跨区域算力调度与资源共享机制。
算力的价值最终体现在应用层面。在现场,《科创板日报》记者还看到了多个太原中心与全国多个机构、高校、企业等的合作项目。
赵崇山介绍到,太原中心目前构建了人工智能、高端装备、工业仿真、生命科学、生态环境、地球科学六大先进计算平台,服务对象涵盖高校、科研院所、大型企业和科技型中小企业。
产业应用层面,太原中心正逐步打通“算力-算法-场景”链条。在人工智能领域,曾支撑科大讯飞星火大模型的国内大型训练任务,提供稳定高效的分布式计算环境,助力模型迭代优化。在金融领域,与北京源晖投资合作开展量化策略回测与风险建模,利用高性能计算提升投资决策效率。
在精准医疗方向,中心与卡替(上海)细胞生物技术公司合作,开展肿瘤免疫治疗相关基因数据分析与药物靶点筛选,缩短临床前研究周期。在交通基建领域,联合山西交通科学研究院进行桥梁结构仿真、隧道受力分析和道路规划优化,提升工程设计的安全性与经济性。
国家超级计算太原中心的建设与运营,反映了我国在高端算力基础设施领域的持续投入与技术积累。赵崇山表示,太原中心依靠“太行一号”主机强大算力基础,坚持超算应用服务与超算生态建设双轮驱动,紧跟未来前沿计算发展趋势,算力服务水平全面提升,在国家战略格局中争创有地位、有特色、有规模的国家超级计算中心。
未来,随着AI大模型发展,对异构算力、弹性调度和跨平台协同的需求将进一步上升,这对包括太原中心在内的全国超算体系,也都提出了更高要求。