①从曾经和文本大模型的“聊几秒”到如今视频大模型的“看几秒”,算力消耗规模正在快速膨胀。
②2025-2030年,分析师预计中国AI推理Token消耗量预计将增长约370倍。
③Token需求“通胀”不仅利好云端算力,也让模型厂商拥有了议价权。
美国英伟达公司创始人兼首席执行官黄仁勋今天在接受总台央视记者采访时宣布两个重要进展:
美国已批准H20芯片销往中国
英伟达将推出RTXpro GPU
英伟达创始人兼首席执行官黄仁勋表示:“美国政府已经批准了我们的出口许可,我们可以开始发货了,所以我们将开始向中国市场销售H20。我非常期待能很快发货H20,对此我感到非常高兴,这真是个非常、非常好的消息。第二个消息是,我们还将发布一款名为RTX Pro的新显卡。这款显卡非常重要,因为它是专为计算机图形、数字孪生和人工智能设计的。”
新闻背景:
美国政府今年4月决定禁止英伟达向中国市场销售其H20芯片。
H20,是为遵守美国出口限制而推出,专为中国市场设计的AI加速器。H20基于英伟达Hopper架构,拥有CoWoS先进封装技术。H20更适用于垂类模型训练、推理,无法满足万亿级大模型训练需求,整体性能略高于910B。