①由于人工智能基础设施的需求激增,三星电子正收到来自谷歌、AMD、特斯拉等全球客户的芯片代工订单;
②尽管台积电计划扩大产能,但短期内产能仍受限,而三星的产能可获得性使其对客户的吸引力与日俱增。
《科创板日报》6月17日讯(记者 李明明)6月17日,智谱发布并开源新一代旗舰大模型GLM-5.2。
在Artificial Analysis综合榜单上,GLM-5.2取得51分,位列开源模型SOTA。
据智谱方面向《科创板日报》记者介绍,这是其迄今能力最强的开源模型,核心只做了两件事:即把1M token上下文从“纸面参数”做成“生产可用”;同时把长程Coding能力再往前推了一步。
《科创板日报》记者第一时间对GLM-5.2 Max进行了数小时连续实测,任务覆盖长上下文检索与生成、Long Horizon长程Agent编码,一次性完成近百万token复合型行业调研全链路交付等场景。
实测GLM-5.2
据智谱方面介绍,GLM-5.2的核心突破在于将百万级上下文窗口做到了工程可用 。
例如,模型可在一轮连续任务中处理88万以上token,自主完成从开发、联调、测试到打包上线的完整软件交付流程,数小时内产出一个覆盖网页端、移动端与小程序的完整应用。而在过去,类似体量的工程通常需要一支团队协作数周。
目前市面上支持百万级上下文的模型并不少,但一个公开的秘密是很多模型在30万token之后就开始"丢信息",长文本下的推理质量呈断崖式下跌。智谱的技术方案是一组注意力结构层面的创新:KV8量化、LayerSplit、IndexShare 4和HiSparse稀疏注意力机制的组合。
从工程角度看,这组改动的目标很明确:在1M长度下同时压低效果衰减和推理成本。智谱官方数据显示,在1M上下文长度下,单位token的FLOPs降低至2.9倍(即相比传统方案减少了约66%的计算量)。
智谱在技术博客中披露了该模型的一个实测结果:模型一次性完成了覆盖Web、移动端与小程序的完整应用开发交付,累计处理88万tokens,几乎用满1M窗口。这意味着在真实的超长工程任务中,模型能够完整保持项目状态,而不是在第十轮对话后就忘了第三轮定下的约束。
《科创板日报》记者也实测了GLM-5.2,实测任务要求模型基于海量公开素材完成K12在线编程教育竞品深度调研,横向覆盖15家赛道主流品牌,拆解课程、师资、定价、家长评价四大核心维度,一次性交付带溯源索引的XLSX数据库、20页PDF完整分析报告、6张可视化对比图表、可复用数据处理脚本全套成果。
经过半小时左右,最终模型完整留存804条家长评价,输出含12个数据分表的标准化Excel、完整行业报告、可运行脚本,全程未出现品牌混淆、数据维度丢失、统计口径错乱等长文本模型常见问题。但1M上下文的极端场景仍有优化空间。


为了进一步验证模型的深度分析研究能力,《科创板日报》记者又下了一个实测指令:基于国家统计局及可公开核验的宏观数据,对 2018-2024 年中国县域消费升级开展系统化研究,构建覆盖 200+ 县域的可溯源数据库,并交付数据底表、研究报告、汇报 PPT 及配套可视化图表。
实测发现, GLM-5.2 Max可单轮承载近百万宏观统计素材,一次性完成全国四百余县域量化数据库搭建、深度分析报告与成套可视化图表全链路交付,适配金融咨询级长周期大数据研究任务。


那么,如何将GLM-5.2的编程能力放在全球最头部模型中进行定位?
北京计算机学会AI专委会秘书长、北京大学特聘研究员张有鱼告诉《科创板日报》记者,智谱GLM-5.2的发布标志着国产模型在编程细分场景取得了关键性突破。
首先,打破双寡头垄断,依托登顶全球编程基准的实测表现与高性价比,GLM-5.2在长上下文编程场景下优势显著,正在重塑行业格局,催生智谱、OpenAI、Anthropic三方鼎立的“新御三家”。
其次,虽未能实现全维度超越,但在目前多数中高频的实际开发场景下,该模型已完全可以作为海外头部模型的替代方案。“但是核心短板仍存,在深度的数理逻辑推理与跨领域知识的复杂融合上,GLM-5.2与海外最顶尖水平相比仍存在一定的技术代差,这是下一步需要重点攻坚的方向。”
国产算力Day 0适配
在性能之外,GLM-5.2以最宽松的 MIT 协议开放,允许免费商用,且模型训练与线上推理均未依赖海外算力。
上线首日,GLM-5.2的线上推理已在Day 0完成与八大国产算力平台的推理适配。这一“开源国模 + 国产算力”的组合受到行业关注。
智谱方面同时对《科创板日报》记者表示,预计下半年昇腾950超节点上市后,将成为GLM-5.2重要的算力底座。
"Day 0适配"不是指模型"能在国产芯片上跑起来",而是意味着在发布当天就已经完成了深度推理适配与算子级优化——这代表国产芯片不是作为"备胎"存在,而是与海外算力平台同等对待的第一梯队底座。
智谱的适配名单覆盖了国产算力的头部企业:华为昇腾、寒武纪、摩尔线程、海光、壁仞、沐曦、昆仑芯、平头哥。既是为了分散供应链风险,也是为了最大化触达不同行业的国产化替代需求。
从商业逻辑来看,当前,国内大模型公司的算力成本中,GPU采购和租赁占据了大头,且高度依赖英伟达H100/H200等海外高端芯片。而在中美科技博弈持续升级的背景下,算力供应链的自主可控已经从"战略储备"变成了"生存必需"。
从开发者视角看,国产算力适配意味着两件事:一是企业用户可以在纯国产环境中私有化部署GLM-5.2,满足数据安全和合规要求;二是当海外算力供应出现波动时,国产替代方案已经准备完善,不需要从头开始适配。
从技术角度看,在多个架构差异显著的国产芯片上完成推理适配,要求模型在算子兼容性、内存管理和推理效率方面做大量工程调优。智谱能够做到Day 0同步适配,表明其底层工程团队在异构计算方面已有较深积累。