①Aegaeon系统在服务数十个参数量高达720亿的大模型时,所需的英伟达H20 GPU数量从1192个减至213个,削减比例高达82%; ②未来AI的发展将不仅依赖于硬件算力的单纯增长,更需要通过系统级的软件创新来深度挖掘现有硬件的潜力。
①昨日晚间,World Labs公布RTFM实时框架模型,能够渲染持久且一致的3D世界; ②World Labs指出,预计针对更大推理预算的更大型模型将继续改进。 ③9月16日,World Labs发布世界生成模型Marble,能实现更优质的几何结构。
①工业和信息化部办公厅组织开展城域“毫秒用算”专项行动,聚焦算力网络发展,构建高在城域内提供毫秒级算力资源网络通达能力速大容量、确定低时延、泛在广覆盖的城域网络。 ②机构指出,“毫秒用算”直接催生了对于高速率(400G/800G)、超低时延、高可靠性网络设备的刚性需求。