①从曾经和文本大模型的“聊几秒”到如今视频大模型的“看几秒”,算力消耗规模正在快速膨胀。 ②2025-2030年,分析师预计中国AI推理Token消耗量预计将增长约370倍。 ③Token需求“通胀”不仅利好云端算力,也让模型厂商拥有了议价权。
《科创板日报》15日讯,MiniMax稀宇科技近日正式发布并开源新一代旗舰模型MiniMax M2.5。依托昇腾AI基础软硬件+AI Agent能力,MiniMax M2.5模型开源后的数小时内即实现在昇腾Atlas 800 A2、Atlas 800 A3适配部署,并在多个现网局点试用,为MiniMax M2.5的规模化落地提供全流程算力支撑。
财联社2月14日电,记者从知情人士处获悉,字节跳动芯片研发团队将开始规模化招聘。该知情人士透露,字节跳动芯片研发团队目前核心集中于芯片设计环节,围绕公司自身业务开展专用硬件定制与优化,面向云端场景研发多款采用先进半导体工艺的复杂芯片,以提升性能、降低算力成本。“目前字节芯片团队已实现多次一版成功流片,早期多个项目进入量产部署阶段,覆盖多个主流先进工艺节点,整体研发与落地节奏稳步推进。”前述知情人士称。对此,字节方面未予回复。
财联社2月13日电,野村证券发布一份AI主题研报,聚焦DeepSeek即将发布的新一代旗舰大语言模型V4。野村认为,作为去年推出DS-V3/R1并搅动全球AI产业链的玩家,DeepSeek的全新技术布局不仅将推动中国AI产业链创新周期加速,更将通过技术创新,在算法与工程层面缩小中国与全球大模型产业的差距。野村研报认为,DS-V4的技术突破将有效打破“芯片墙”与“内存墙”的桎梏,赋能本土算力硬件与AI应用双向发展,推动中国开源大模型生态走向成熟。
《科创板日报》13日讯,北京3D AI芯片创企算苗科技近期连续完成两轮累计规模近10亿元融资,募集资金将用于100%国产化3D算力芯片的研发和量产。其中,Pre-A轮融资由源码资本、石溪资本联合领投,联想创投等多家半导体核心产业方跟投;Pre-A1轮融资由襄禾资本领投,同时获国开金融、北京顺禧等国资背景资本加持。算苗科技成立于2022年11月,核心产品是AI大模型推理3D定制化芯片,希望通过计算机体系结构创新和国内3D IC供应链来解决“内存墙”难题。
财联社2月13日电,AI应用在千行百业快速落地,带动算力需求快速增长,使得云计算服务商有了涨价底气。2月11日,云计算服务商优刻得发布涨价公告,决定自3月1日起对续签及新签用户的全线产品与服务进行价格上浮调整。多家云计算服务商在接受记者采访时表示,在需求端爆发、供给端出现瓶颈的情况下,云计算租赁服务涨价不是短期的价格波动,也不会是某家公司的个体行为,而是意味着产业迎来结构性景气拐点,全行业涨价即将到来。记者注意到,在AI需求超预期的情况下,从上游核心芯片的GPU到中游网络配套的光模块,再到下游基础设施的云计算中心,整个算力产业持续处于高景气周期,相关上市公司业绩也获得持续增长。
财联社2月12日电,深圳市工业和信息化局近日印发《深圳市“人工智能+”先进制造业行动计划(2026—2027年)》,其中提出,构建算法开源、数据共享、算力协同的公共服务能力,整合技术资源与行业数据,降低中小企业智能化改造门槛,提升行业智能化改造的渗透率与应用深度。强化龙头企业引领作用,联合产业链上下游企业共同发掘潜在应用场景,支持人工智能在产品设计、产品检测、运营管理、质量检测、安全生产、数据分析等核心环节深度应用,打造一批标杆示范项目。聚焦终端产品创新升级,支持AI手机、AI眼镜、AI+潮玩、AI+智慧屏等重点产品研发创新,通过产品创新牵引技术迭代,培育新的产业增长点。
《科创板日报》12日讯,《科创板日报》记者获悉,2月12日凌晨,智谱发布新一代旗舰模型 GLM-5, 目前,GLM-5 已完成与华为昇腾、摩尔线程、寒武纪、昆仑芯、沐曦、燧原、海光等主流国产芯片平台的深度推理适配与算子级优化,能够在国产算力集群上实现高吞吐、低延迟的稳定运行。(记者 李明明)
财联社2月12日电,智谱2月12日发布GLM Coding Plan 价格调整函称,近期,GLM Coding Plan市场需求持续强劲增长,用户规模与调用量快速提升。为保障高负载下的稳定性与服务质量,公司同步加大算力与模型优化投入,产品能力持续升级。基于实际使用情况与资源投入变化,公司决定对GLM Coding Plan套餐价格体系进行结构性调整。调整内容如下:取消首购优惠,保留按季按年订阅优惠;套餐价格进行结构性调整,整体涨幅自30%起;已订阅用户价格保持不变。生效时间:2026年2月12日。
财联社2月11日电,国务院国资委日前提出,中央企业要强化投资牵引,积极扩大算力有效投资,推进“算力+电力”协同发展,提升全链条数据治理能力,不断夯实人工智能产业基础底座。国务院国资委日前召开中央企业“AI+”专项行动深化部署会。此次会议上,国务院国资委提出央企要强化自主创新,着力突破关键核心技术,持续攻关“大模型”技术,推动更多自主创新成果从样品变成产品、形成产业;要强化场景培育,加强人工智能与主责主业、产业需求的精准对接,在高适配、高价值、高可靠上下更大功夫,推动人工智能规模化落地应用。此外,国务院国资委要求中央企业强化开源开放协同,加快推动开源“焕新社区”迭代升级,努力成为“赋能型企业”,推进“AI+”产业共同体建设,不断涵养互利共赢的产业生态。
财联社2月11日电,微软在最新官方博客中披露,正评估将高温超导(HTS)电缆引入数据中心供电体系,以降低损耗、压缩体积并提升电力密度,缓解AI算力扩张下的基础设施约束。该方向一旦落地,或将重塑数据中心电力架构,并对超导材料、先进电网及核聚变产业链形成长期拉动。
财联社2月11日电,科大讯飞正式发布基于全国产算力训练的星火X2大模型。从X1.5到X2,此次升级有两大亮点:通用能力全面升级,星火X2整体能力对标国际顶尖模型水平,在数学、推理、语言理解、智能体等能力上媲美国际最优;130+多语言综合能力继续提升。依托星火X2的算法突破、行业高质量数据集以及专业思维链的强化学习,星火行业大模型持续升级,产品应用方案取得显著进步。
财联社2月11日电,中芯国际联合首席执行官赵海军在业绩交流会上表示,AI需求在一定时间内“永远无法满足”。“现在大家算力都不够,因为对AI有宏大设想,巴不得在一两年内建成未来十年需要的数据中心,至于建起来之后要干嘛还没完全想清楚。”赵海军判断,在这种情况下,业界还在重投资存储技术,HBM缺货在几年内应该会持续。不过,未来制约HBM产能的将不是前端的晶圆生产环节,而是后端的测试等环节。赵海军预测,接下来存储器产能会增加,厂商买设备快的能4个月拿到,慢的9个月也能拿到,9个月后就能看到晶圆前端生产产能增加。这些产能不能直接用来做AI数据中心所需的HBM,而是会马上投放到消费类产品上。这时中间通道商手里的囤货会释放出来,给到手机、电脑产品,或将在今年第三季度带来消费类产品包括中低端手机市场的反转。
财联社2月10日电,据浙江省人民政府网,《浙江省国民经济和社会发展第十五个五年规划纲要》2月10日正式发布。其中提出,统筹布局新型数字基础设施,探索建设通算、智算、超算、量算融合的算力体系,前瞻布局时空智能、太空计算基础设施。规模部署5G-A网络和万兆光网,前瞻布局6G、卫星互联网等新通信网络,建成5G-A基站9万个、50G-PON端口15万个。推进传统基础设施更新和数智化改造,加快智慧公路、智慧航道建设,推进环杭州湾车路云、浙北航道船岸云集成应用,深化“杭州—桐乡—德清”智能网联汽车“车路云一体化”应用。推动宁波舟山港传统集装箱、干散货码头智慧化改造。谋划建设杭州湾南翼绍兴低空安全新基建。推进数智水利建设,构建“天空地水工”一体化监测感知体系。推动交通、水利、能源、气象等基础设施跨领域融合发展。
财联社2月9日电,意法半导体2月9日宣布,通过一项为期多年、涉及多个产品类别的数十亿美元商业合作,与亚马逊云科技(AWS)深化战略协作,此次合作确立意法半导体为AWS先进半导体技术与产品的战略供应商,技术将集成于AWS计算基础设施中。意法半导体称,此次合作涵盖广泛的半导体解决方案,意法半导体将提供涵盖高带宽连接的专属技术能力,包括高性能混合信号处理、用于智能基础设施管理的先进微控制器,以及满足超大规模数据中心运营所需能效要求的模拟与电源集成电路。
财联社2月9日电,英伟达CEO黄仁勋在接受外媒采访时表示,科技行业在AI(人工智能)基础设施方面不断增长的资本支出是合理、适当且可持续的,因为这些公司的现金流都将开始增长。包括微软、亚马逊、Meta、甲骨文公司和Alphabet在内的科技巨头,正计划在2026年总计投入超过6000亿美元的资本支出。黄仁勋强调,“人类历史上规模最大的基础设施建设”正在展开,其背后动力是对算力的“极度旺盛”的需求,AI公司和超大规模云服务商正利用这些算力来创造更多收入。
《科创板日报》9日讯,游戏科学CEO冯骥对字节Seedance 2.0评价称:“AI理解多模态信息并整合的能力完成了一次飞跃,令人惊叹。”他表示,一般性视频的制作成本将无法再沿用影视行业的传统逻辑,开始逐渐趋近算力的边际成本。内容领域必将迎来史无前例的通货膨胀,传统组织结构与制作流程会被彻底重构。此外,冯骥针对“假视频泛滥与信任危机”作出提醒,“我很庆幸,至少今天的Seedance 2.0,来自中国。”他表示。
财联社2月9日电,澳大利亚人工智能基础设施公司Firmus Technologies宣布,已获得黑石集团旗下黑石战术机会基金、黑石信贷与保险基金及关联基金领投,并由金融投资机构Coatue共同参与的100亿美元债务融资。Firmus表示,此次融资将用于该公司数据中心扩建的下一阶段,其计划到2028年在澳大利亚建造总容量高达1.6千兆瓦的数据中心。
财联社2月8日电,国产全栈高性能GPU在医疗AI领域的应用解决方案在昨天举行的上海市健康数据产业协会第一届第二次会员大会暨高质量发展学术大会上发布。这项医疗AI领域的应用解决方案是复旦大学附属中山医院牵头建设的国家人工智能应用中试基地(医疗领域)孵化的重要产出,它将大幅降低医疗人工智能推广应用门槛,助力医疗人工智能从“数智创新”走向“生产力工具”。大会上,沐曦集成电路 (上海) 股份有限公司及生态企业与上海市健康数据产业协会现场签订合作协议,沐曦宣布为协会提供算力券等多元支持。