财联社
财经通讯社
打开APP
英伟达LPU新品会挤压HBM市场?黄仁勋早就澄清过这个误解
①英伟达GTC大会前夕,有关推出Groq芯片推理系统的传言,引发“SRAM路线将削弱HBM需求”的市场猜测;
                ②但事实上,两者并不是简单的“互相替代”关系。

财联社3月5日讯(编辑 史正丞)随着韩国股市近3天坐上“过山车”,一些揣测也在股价巨震期间敲打着股民们紧绷的神经。

作为背景,上周五美股收盘后有爆料称,英伟达将在当地时间3月16日举行的GTC大会上发布一款专门用于推理计算的新系统,这个新平台将采用初创公司Groq设计的芯片。

随着上周末中东战火重燃,韩国股市周一休市后,周二、周三均遭遇大跌,三星电子、SK海力士均累计跌近20%。除了中东战火外,市场里似乎也有一些声音将内存巨头的大跌归因于“Groq抢了HBM的饭碗”。

(三星电子、SK海力士周四均强劲反弹,来源:TradingView)

何来忧虑?

作为背景,英伟达去年底豪掷200亿美元,获得芯片初创公司Groq的人才团队和非独占专利授权。这也是英伟达在核心算力芯片产品上首次大规模引入外部架构。

引发部分三星、海力士股东焦虑的点,正是Groq自研的LPU(语言处理单元)芯片。该芯片的核心特点是在片上集成数百兆SRAM(访问速度比HBM快约20倍),通过减少或者完全不调用外部存储,实现超低延迟的token输出。

随着英伟达发布会临近,“Groq是否利空HBM”又被拿来讨论:如果推理芯片路线从HBM堆料转向片上SRAM,存储公司的生意不是被抢走了么?

作为这一猜想的佐证,OpenAI上周五在宣布获得英伟达300亿美元融资时,就专门强调将从该公司购买大量“专用推理算力”,暗示了这款新型处理器的存在。

黄仁勋也曾表示,将在GTC上发布“世界前所未见”的全新芯片。市场猜测,如果不是Rubin CPX或下一代Feynman架构的GPU旗舰产品,确有可能是以SRAM为核心的LPU。

两者真的是替代关系么?

对于这种说法,韩国科技分析师Jukan周四开盘前引用独立分析机构KIS的分析称,认为SRAM推理芯片的出现将减少HBM使用的想法,反映出对存储器的理解不足

分析称,与DRAM相比,SRAM的单元面积大、密度低。相同容量的SRAM需要DRAM 5到10倍的芯片面积,因此也限制了容量的扩展。正因如此,SRAM历来被用于对延迟要求极低的缓存或片上缓冲区应用,而不是作为存储大量数据的主存储器。

因此,与其说取代GPU,这类芯片更多会成为针对特定推理工作的额外选择,例如需要极低延迟的物理AI边缘应用(机器人和自动驾驶),而不是取代HBM或DRAM。

事实上,英伟达CEO黄仁勋也在1月CES的分析师问答活动上详细解释过这件事。

黄仁勋表示,如果把所有东西都放在SRAM里,那么当然就不需要HBM内存了。但问题是:能够放进这些SRAM里的模型规模会小大约100倍。工作负载的形态一直在变化,有时候会遇到MoE模型,还有多模态模型等,因此英伟达需要提供普适性的解决方案。

黄仁勋也指出,对于某些特定工作负载来说,SRAM可能会“快得惊人”,因此在预填充阶段和解码阶段可以看到一些好处。

环球市场情报 美股动态
财联社声明:文章内容仅供参考,不构成投资建议。投资者据此操作,风险自担。
商务合作
热门解锁
相关阅读
评论
发送
复制
取消
垃圾广告
政治激进内容
色情低俗内容
取消