①通过发布Rubin CPX,英伟达将推理计算过程拆分为上下文与生成两个阶段,分别由两块GPU运算,效率最高可达现有旗舰机架的6.5倍; ②英伟达预计,客户部署1亿美元的新设备可带来高达50亿美元收入。
①阿联酋穆罕默德·本·扎耶德人工智能大学与G42共同推出低成本推理模型“K2 Think”,宣称仅需320亿参数,性能超越规模大20倍的模型; ②该模型基于阿里巴巴开源Qwen 2.5构建,采用长链式思维监督微调和推理阶段扩展等方法提升性能,为数学、科学等特定应用领域而设计。
①征求意见稿提出,杭州计划到2027年,全市人工智能终端产业规模力争达到3000亿元; ②方案提出实施人工智能终端方向重点科研计划项目100个,打造爆款终端产品30款,培育形成自主品牌20个,选树典型应用场景50个。