财联社
财经通讯社
打开APP
亚马逊新款AI芯片上市!下一代芯片将与英伟达生态“合体”
①亚马逊在re:Invent大会期间发布AI芯片Trainium3,性能较上一代最高提升4.4倍、训练成本最多降低50%,主打“性价比路线”;
                ②亚马逊明确表示,没想过要取代英伟达,下一代产品更是将积极拥抱英伟达软件生态。

财联社12月3日讯(编辑 史正丞)北京时间周三凌晨,全球云计算“一哥”亚马逊AWS在Re:Invent大会期间宣布,华尔街翘首期待的新一代自研AI芯片Trainium3正式公开上市。

综合公司介绍,Trainium3是亚马逊首款3nm制程芯片。与上一代Trainium芯片相比,Trainium3计算性能最高提升4.4倍,能效提升4倍,内存带宽几乎提升4倍,主打AI算力竞争的性价比赛道。由Trainium3组成的UltraServer系统还可以互联,每台可容纳144枚芯片,为单个应用提供多达100万枚Trainium3芯片,为上一代的10倍。

公司表示,与同样使用图形处理单元(GPU)的系统相比,训练和运行AI模型的成本能够降低最多50%

当然,指望亚马逊Trainium3与谷歌TPU一战,甚至“挑战英伟达”的投资者可能会有些失望,毕竟没有任何资料显示这款芯片除了“性价比”之外的其他优势。

亚马逊拒绝透露新款AI芯片与谷歌、英伟达最新产品的基准性能对比,也未披露功耗参数。目前我们仅知道每枚芯片集成144GB的高带宽内存,而谷歌最新的Ironwood TPU为192GB,英伟达的Blackwell GB300则最高可达288GB。

负责Trainium项目的AWS副总裁兼首席架构师Ron Diamant也直言:“我不认为我们会试图取代英伟达”。

Diamant进一步表示,归根结底,这款自研芯片最大的优势就是性价比。他的主要目标是为客户在不同的计算工作负载上提供更多选择。

对于亚马逊的AI芯片而言,最大的短板并不是芯片本身,而是亚马逊缺乏足够有深度且易于使用的软件库

除了亚马逊自己以及公司大力投资的AI初创企业Anthropic外,现在几乎找不到使用Trainium芯片的知名公司。

而Anthropic也在10月表示,将采购最多100万块谷歌的TPU,又在11月宣布与英伟达签署投资入股协议,并将进一步购买英伟达芯片的算力。不过Anthropic也强调,亚马逊仍然是其“主要的训练合作伙伴和云服务提供商”, 预计到年底将使用超过一百万颗Trainium 2芯片。

使用人工智能赋能施工设备自动化的Bedrock Robotics介绍称,公司基础设施运行在AWS服务器上,但在为挖掘机构建引导模型时,就得用英伟达芯片。公司首席技术官Kevin Peterson总结称:“我们需要它既高性能又易于使用,那就是英伟达。

亚马逊似乎也意识到了这个问题。在Trainium3的公告中,公司特别强调Trainium4已在研发中,最大的亮点是“能与英伟达芯片协同工作”。

公司表示,Trainium4将支持英伟达NVLink Fusion高速芯片互连技术,最终形成一种兼顾GPU与Trainium服务器的经济高效机架级AI基础设施。

英伟达介绍称,NVLink Fusion的核心是NVLink Fusion chiplet,超大规模云服务商可以将该chiplet嵌入其定制ASIC设计中,以连接NVLink规模化互联和NVLink交换机。

(NVLink Fusion芯片组使72个定制ASIC以每个ASIC 3.6 TB/s的带宽实现全互联,来源:英伟达)

这意味着,基于Trainium4的系统将能够与英伟达GPU互操作,并提升整体性能,同时依然使用亚马逊自研的、更低成本的服务器机柜技术。这也将使得那些以英伟达GPU为核心构建的大型AI应用,更容易迁移到AWS。

环球市场情报 美股动态
财联社声明:文章内容仅供参考,不构成投资建议。投资者据此操作,风险自担。
商务合作
热门解锁
相关阅读
评论
发送
复制
取消
垃圾广告
政治激进内容
色情低俗内容
取消