近期,中信证券研报表示,下一代大模型(如GPT-5),有望成为决定本轮AI产业前景的关键变量。基于学术与产业界现有的成果与研讨方向,尝试建立下一代大模型的研究框架,从模型基座、性能、生态、产业等角度展开分析,期待其有望以2-3倍参数规模,实现近10倍智能水平,并显著提升推理性价比。同时,下一代大模型在逻辑推理、原生多模态、记忆系统等关键能力突破,将加速高价值复杂行业场景应用落地。
为探索AI大模型进展对应用端和算力端可能带来的影响,财联社VIP特联合蜂网火线直连“AI大模型”行业专家,调研AI大模型的最新进展和对下游应用场景带来的催化等。
【核心逻辑】
【交流纪要】
问题一:近期各个AI大模型有哪些新的进展?
专家:近期全球AI大模型在架构革新、多模态融合与端侧应用等领域进展迅猛。谷歌Gemini采用混合专家(MoE)架构后,推理效率较前代提升50%;其视频生成模型VideoPoet支持128秒长镜头合成,好莱坞制片公司已将其用于分镜预演。OpenAI的GPT-5完成多轮人类偏好强化训练,在律师资格考试(UBE)中得分率达92%,较GPT-4提升11个百分点,但商业化进程受算力限制推迟。
问题二:本轮大模型更新对哪些下游应用场景的推动作用更大?
专家:近期大模型的技术突破正在深刻重塑多个下游应用场景的格局与效能。在医疗健康领域,阿里千帆的端云协同架构将电子病历分析时延压缩至200毫秒以内,北京协和医院试点中实现门诊决策支持响应速度提升4倍;华为盘古矿业大模型透水事故预测准确率达91%,已部署于全国多座煤矿,较传统传感器方案预警提前12小时。同时,谷歌Med-PaLM 2通过美国医师执照考试(准确率92%),赋能印度Apollo医院远程诊疗系统,误诊率下降37%。
另外,金融、法律等专业服务正在加速智能化渗透。彭博GPT专有模型处理全球央行政策文件,宏观经济预测时效性提升至分钟级。国内恒生电子的大模型,机构研报关键数据提取误差率降至0.3%,分析师人工核查工作量减少70%。
问题三:本次大模型的进步对算力硬件的需求有多大影响?
专家:大模型技术跃迁正驱动算力硬件需求呈现指数级增长与结构性变革。谷歌Gemini 2.0的MoE架构使单次推理计算量增加40%,直接推动其数据中心GPU采购量从Q2的4.5万张跃升至Q4的8万张;微软为支持GPT-5的128K长上下文训练,Blackwell架构GPU集群规模较GPT-4时期扩大3倍,单集群超2万卡。OpenAI因算力缺口推迟GPT-5商用,突显万亿参数模型对硬件资源的恐怖吞噬——训练单次迭代需消耗价值780万美元的算力资源(2023年仅需220万美元)。
散热与能效革新催生千亿市场。单机柜功率密度突破100kW,推动液冷渗透率从2023年35%飙升至2025年78%,高澜股份液冷板订单排产至2026Q2;台积电CoWoS封装技术使3D堆叠芯片热阻降低50%,日月光相关产线资本开支增加40%。另外,电源系统重构也势在必行。
问题四:哪些AI算力硬件企业的业绩有望大幅跟随上涨?
专家:大模型技术跃迁正推动算力硬件企业业绩呈现结构性爆发,核心增长点集中于高端芯片、先进封装及散热解决方案领域。台积电CoWoS封装产能扩张至每月4万片仍供不应求,3nm晶圆代工业务营收占比突破35%,带动毛利率重返60%高位。
光通信企业迎来量价齐升周期。中际旭创1.6T光模块获谷歌、Meta批量采购,单季度出货量突破5万只,苏州工厂产能利用率超140%;新易盛800G硅光模块良率提升至85%,单月营收连续3个月创历史新高。剑桥科技LPO方案通过英伟达认证,单季度毛利率提升至38%(上年同期仅22%),北美数据中心客户采购量季度环比翻倍。
国产算力链企业业绩弹性显著。寒武纪昆山智算中心首批5万卡订单落地,推动Q2营收同比大幅增长;海光信息中标中国移动8亿元AI服务器集采项目。中科曙光液冷服务器渗透率提升至65%,天津基地扩产项目提前投产。
封装材料与设备商进入高增长通道。联瑞新材Low-α球硅填补HBM封装空白,产品单价较传统填料高300%,SK海力士采购占比提升至30%;拓荆科技PECVD设备打入国内HBM产线,二期订单金额超10亿元。雅克科技前驱体材料通过三星认证,宜兴工厂产能利用率达120%。