财联社
财经通讯社
打开APP
刚刚!华为发布一系列Agentic AI新品 千卡集群每秒吞吐达500万Tokens
①AICS灵衢智算集群支持10万卡级集群规模,总算力达200EFLOPS,千卡每秒吞吐达到500万Tokens。
                ②华为云发布全球首个全流程具身智能开发平台CloudRobo,新松机器人、亿嘉和、凌云光旗下元客视界等入驻具身智能专区。

《科创板日报》6月5日讯(记者 黄心怡)在今日举行的华为云INSPIRE创想者大会上,华为云发布Agentic Infra通智一体化基础设施、新一代模型训推平台、企业级智能体平台等系列Agentic AI新品。大会还宣布正式上线“行业AI梦工厂”智慧医疗、具身智能、智能制造、科学计算四大专区。

▍AICS灵衢智算集群 千卡每秒吞吐达到500万Tokens

华为云在会上发布四大Agentic Infra新品。

其中,AICS灵衢智算集群基于超大带宽灵衢网络,支持10万卡级集群规模,总算力高达200EFLOPS,并将Tokens生成的时延降低到10毫秒以内,千卡每秒吞吐达到500万Tokens,在线服务可用性高达99.95%,打造极致效率的Token工厂。

记者了解到,这是基于灵衢网络的昇腾950芯片智算集群服务,而千卡每秒吞吐达到500万Tokens的指标,是基于DeepSeek大模型的服务吞吐量。

此前,DeepSeek方面曾表示,受限于高端算力,目前V4-Pro的服务吞吐仍有限,预计下半年昇腾950超节点批量上市后,Pro价格会大幅下调。

华为公司董事、华为云CEO周跃峰在采访中对《科创板日报》等媒体表示,华为云坚持自主自强的发展道路,以独立自主的算力芯片为基础,坚定推进国产化。

华为公司董事、华为云CEO周跃峰

他提到,算力成本是一大挑战。“大模型普遍是万亿参数,明年可预见将参数规模提升到2T、3T,甚至于10T(10万亿),打造这些模型的算力资源也将翻倍增长。不可能每个机构和公司都自行打造万卡集群,而是通过公有云来承载通用大模型,并借助机密推理和训练来实现资源的高效安全共享。”

AMS Agentic记忆存储解决方案通过NPU直通CMS(上下文记忆存储)硬件,打造PB级超大记忆空间,并支持KV Cache分层池化,降低推理成本的同时支持天级长程任务,打破Agent的记忆瓶颈;CCE Volcano Next通智一体化调度引擎通过“训推共池+碎片整合”实现通智混合算力负载调度革新,可将资源利用率提升30%以上;AgentSphere用于构建 Agent运行环境,凭借羽量级沙箱技术实现100毫秒级极速启动与每分钟十万级批创能力。

此外,华为还发布新一代ModelArtsNext模型训推平台,构建了RL强化学习服务、机密推理、模型路由、模型矩阵四大能力。其中,MaaS模型路由支持成本优先、效果优先、均衡模式三种策略,根据请求特征动态智能择优调度最佳模型。截至目前,已提供15余款SOTA模型服务,模型调度精准率超过95%,调用成本平均降低20%。

华为云正式公测智果(AgentArts)企业级智能体平台,采用Harness工程体系。智果开源版openJiuwen也已经上线。同时,华为云发布全新Agentic华为云入口“智果园”,提供Agentic云服务、智能体、大模型等能力,并将这些能力全面Skill化、CLI化,完成从意图理解、功能开发、资源发放到应用部署的智能体化,提供Tokens服务。

会上,华为云联合智谱、DeepSeek、Minimax、Kimi、阶跃星辰、百度、美团LongCat、讯飞星火、爱诗科技、生数科技等20余家TOP模型厂商,发布“百模千态,云聚共赢”生态合作计划。

周跃峰表示,希望通过“百模千态”行动计划,提升华为云服务的token效率。未来几年的重点方向是面向智能体,做好硅基黑土地和相关的软件和硬件。

▍全球首个全流程具身智能开发平台CloudRobo发布

华为云在会上发布行业AI梦工厂四大专区。在智慧医疗专区方面,华为云医疗AI使能平台将于6月30日升级并公测。华为云智慧病理方案已在全国实现规模复制,覆盖顶级三甲、地市级、县域医院。大会现场,包括上海交通大学医学院附属瑞金医院、邯郸市中心医院、河北工程大学附属医院、瑞安市人民医院、黔西南州兴义市人民医院、武安市第一人民医院等20余家医院正式入驻智慧医疗专区。

具身智能专区提供一站式具身智能数据合成、模型开发、仿真验证平台,帮助具身智能企业加速场景落地。同时华为云发布全球首个全流程具身智能开发平台CloudRobo,提供PB级数据底座及开发管线、业界首个云原生具身模型生产引擎及首个全国产Real-Sim数据生产及模型评测体系,帮助机器人小时级上云,模型分钟级部署。该平台将于6月30日公测。

记者在现场看到,新松机器人、乐聚机器人、深朴智能、亿嘉和、凌云光旗下元客视界、上海交大、拓斯达、优艾智合、枢途科技、前海宝安具身智能产业创新中心、国地共建人形机器人创新中心、东北亚具身智能创新中心、广东省具身智能训练场、千寻智能、无锡数据集团、清华大学、自变量、华沿机器人、五八智能、智身科技等首批入驻专区。

本次大会还发布了智能制造专区,提供一站式工业智能体创新创业环境,使能工业智能体创新落地;发布科学计算专区,面向AI4S行业客户提供统一丰富的模型、智能体使用体验,助力科研创新。

周跃峰透露,与其他云计算厂商不同,华为云将重点深耕行业应用,下半年还将推出更多专区

“AI技术为国计民生相关行业带来生产力提升,这是华为云的根本目标。我们不太关注token总量或收入总量,而是关注国产化算力系统所产出的token背后带来的价值提升,能否匹配各行业需求,实现善政、惠民、兴业的目标。”

周跃峰认为,不能单纯以使用量来评判token的价值,更应看重token背后对生产力带来的实际贡献。“以金融行业为例,我们关注的是防范了多少金融风险、提升了多少信贷业务效率等。”

谈及AI是否存在泡沫,周跃峰表示,AI的发展方向一定是正确的,但投资需要有回报,而回报的核心正是生产力的提升。医疗、金融等行业的数字化进程相对较快,也应率先推动这些行业的发展。

人工智能 TMT行业观察
财联社声明:文章内容仅供参考,不构成投资建议。投资者据此操作,风险自担。
商务合作
热门解锁
相关阅读
评论
发送
复制
取消
垃圾广告
政治激进内容
色情低俗内容
取消