
①6月25日,海光信息与同济大学正式签署战略合作协议,并推出国内首个国产千卡工科智算集群; ②海光信息介绍,AI4E直面工程仿真、智能建造、工业研发等实体产业场景,对算力提出了区别于通用AI的复合需求。
《科创板日报》6月26日讯(记者 郭辉) 国内首个国产千卡工科智算集群落地上海。
6月25日,海光信息与同济大学正式签署战略合作协议,并推出国内首个国产千卡工科智算集群。这是国产算力首次以工程专用形态服务高校教育教研,标志着AI基础设施从科学智能向工程智能的关键延伸。
据介绍,集群将以全国产的海光DCU为核心算力底座,采用超智融合架构,可同步承载高端计算与AI训练推理任务。在工程应用层面,集群对结构仿真、流体力学等核心工科场景进行了深度适配,并通过海光自研软件栈兼容主流工程软件生态,使已有工程代码能够低成本迁移至国产算力平台。除此之外,海光DCU可全面支撑大模型安全护栏应用,在关键数据保护和模型输出管控等环节,为涉及重大工程数据的科研任务提供安全保障。
海光信息总裁沙超群表示,此次合作是国产算力从AI4S到AI4E纵深落地的开创性攻关。AI4E直面工程仿真、智能建造、工业研发等实体产业场景,对算力提出了区别于通用AI的复合需求。
同济大学党委书记、中国工程院院士郑庆华表示,依托集群算力支撑,学校将推动科研范式向科学智能与工程智能融合驱动模式转变,培养更多兼具工程素养与AI能力的复合型人才。
在发布会后,海光信息总裁沙超群接受了《科创板日报》等媒体的采访,就AI4E应用对算力底座的挑战、未来国产算力建设的发展路径、算力芯片的融合创新趋势等进行了交流分享。
聚焦AI制造业工程化落地难题
沙超群在致辞中表示,过去高校应用的算力市场普遍面临诸如适配难、迁移贵、算力弱的痛点。而AI和工程实体产业的深度融合,进一步要求算力在兼容性、应用性、稳定性等方面能够提供可靠支撑。
“海光与同济大学通力协作打造的算力引擎,其特点并不在于算力规模有多大、算力精度的覆盖度有多广,而是聚焦关键性、垂直性的实际的应用场景,来给出相匹配的系统化解决方案,让高校的工程智能研究更加得心应手,让已有的存量代码迁移更加平滑,让模型的应用能够快速上线。”沙超群如是称。
海光信息此次携手同济大学,建设千卡工科智算集群,真正要解决的问题是AI在制造业的工程化落地问题。
集群面向AI4E(AI for engineering)场景进行了深度优化,既满足大模型训练推理,也支持工程仿真和科学计算,科研人员可以在统一平台上开展工作,并实现降本增效。希望为更多高校推进人工智能赋能工程教育和工程科技创新提供实践样板。
相比于通用算力,AI4E工程智能所面对的垂直领域,对底层算力设施提出了新的要求。
沙超群在接受《科创板日报》记者采访时表示,大模型算力主要分为训练、推理两大板块。其中训练端遵循Scaling Law缩放定律,模型参数从百亿、千亿发展到如今的万亿级别,对算力规模、集群扩展能力要求不断提升,且具备高算力、高吞吐的密集型特征;而海量并发推理场景,侧重优化Profile、Decode流程,核心思路是降低Token输出成本,以此实现算力高效利用。
而AI4E的应用方向,则涵盖多类工业垂直场景。沙超群表示,这类场景并不需要超大算力模型规模,但对模型的适配能力、通用迁移能力要求很高,需实现快速落地移植。并且多样的工程化场景,要分为计算密集型、数据密集型、通讯密集型等不同类型计算需求,为此海光需要在工程计算的框架下根据各种应用来做算子、库、运行时进行优化,针对应用框架层更好地适配场景应用。
沙超群表示,从整个全球在AI领域的资本开支来看,AI基建的投资加速,业内对市场前景十分看好。未来国内算力基础设施建设仍将以国产供应链为主,空间增长潜力巨大,与此同时对海光等算力基座厂商提出了更高的要求。
阐释未来国产算力发展路径
进入到AI应用的深水区,关于应对未来国产算力建设的挑战的问题,海光信息在6月25日接受《科创板日报》等媒体采访时,进一步阐释其三大战略方向。
沙超群表示,此前Chatbot时代对芯片需求主要集中于GPU,而在AI智能体时代,CPU要承担更多的工作,无论是对于智能体的编排、记忆与上下文调度,还是出现不同Agent算力砂箱,需求在不断变化,为此对国产算力的发展有三个方面的设想。
“从英伟达Blackwell架构到Rubin GPU架构的迭代,Token的性价比有了几倍提升,其原因更多是系统层面不再是单一的一颗GPU芯片。”沙超群表示,对海光来说也有类似的产品系列和路径, “我们有海光CPU、DCU双芯算力底座,还有配套Scale-up场景的HySwitch高速交换芯片、RDMA网卡与交换整机,同时依托光合组织生态完成全链路国产化智算系统方案,未来行业将看到更多千卡、万卡规模的系统。”
在系统能力的提升之外,沙超群还提及生态开放的发展趋势。海光在国产算力产业,持续倡导开源开放路线,过去不仅开放了海光DCU与软件栈,同时对外开源自研CPU高速互联总线HSL,打通了海光CPU与DCU,并牵头成立专项工作组,目前已有大量产业链芯片厂商参与共建。开源、开放也是光合组织一直倡导的核心理念。
此外,沙超群表示,海光还将通过软硬件深度协同,依托系统层面优化充分释放整机综合性能;同时联合光合组织数千家应用企业、AI优化合作伙伴以及国内各大大模型厂商共建方案,打造训练算力更强、推理场景性价比更优的国产算力整体方案。
未来的Agent时代,CPU承担的任务比重将会越来越多,同时CPU与DCU正在走向产品功能的深度融合。
据介绍,此前行业采用异构双芯搭配方案时,CPU与加速芯片分属不同架构,跨架构适配、调优与协同工作会带来明显性能损耗。基于海光“CPU+DCU”双芯一体化方案,用户无需区分算力优化工作由CPU还是DCU承载,整套系统可统一输出高效算力,能够大幅降低高校科研人员等用户的开发适配成本。
因此,未来CPU将承载更多原本由加速芯片承担的运算任务,部分轻量化应用也可直接运行在DCU上,而对于仅布局单一品类芯片的厂商而言,很难匹配这类复合需求。
据海光透露,海光同时拥有CPU、DCU完整产品,具备先天技术底座,已提前准备双芯融合的相关技术开发。