①bauma CHINA 2024, 11月26-29日将在上海新国际博览中心举行; ②包括卡特彼勒、徐工集团、三一集团、中联重科等3400余家国内外标杆企业参展,预计超20万全球买家参会。
财联社11月19日讯(记者 付静)今年以来人工智能持续火热,第二十五届中国国际高新技术成果交易会(下称“高交会”)上,人工智能领域多家上市公司携新品发布。财联社记者现场观察到,AI算力层面,英伟达虽未现身此次高交会,登台亮相的诸多AI算力厂商却使其成为“隐形焦点”,而大模型厂商已“卷”至下半场,逐步瞄准AI场景落地应用。
英伟达成“隐形焦点”
在“改变世界的新兴科技”论坛,今年以来A股备受关注的算力租赁股鸿博股份(002229.SZ)副总裁、英博数科CEO周韡韡高调回应市场上“算力妖股”的说法:“许多人看到了鸿博股份股价的成长,甚至评价我们是靠算力概念的第一妖股。但他们却没看到,我们动辄就是以亿元为单位起跳的投入,我们所有工作人员用各种软硬件组合加速不同类型的模型,适配调优不断失败又不断重来,以及向各个不同行业不同认知的专业人士一边学习一边科普,又共同讨论寻找AGI商业变化。”
(财联社记者摄于论坛现场)
截至11月17日收盘,鸿博股份股价年内涨幅为437.44%。
周韡韡表示,英博数科因今年年初交付了国内第一个市场化运行的英伟达DGX推荐架构标准智算单元的智算集群而受到市场关注,如今公司在手超3000P算力,年底将实现超过万P算力调度,且所有算力均基于英伟达A和H系列组成。完成万P规划后,公司定位将从最初的AI多模态大模型训练平台升级为AGI全栈式服务商。
她直言,“正是由于AGI产业发展给鸿博股份在短短几个月内带来百亿市值增长的机会,能够让英博数科这样成立一年多的小公司实现一个季度收入100倍以上的增长,也给了我们能够侥幸地与过去仰望但不可及的大厂们在同一起跑线竞技的机会。”
财联社记者注意到,英伟达话题在展区亦是热度颇高。初创公司潞晨科技的展台里,一个被放置在C位的英伟达箱子引来不少业内人士驻足,有人已在询问产品配置和报价信息。展台工作人员告诉财联社记者,此为搭载H800显卡的Colossal-AI一体机。
(财联社记者摄)
据了解,该一体机自带GPT、LLaMA等模型,1小时可完成模型微调,模型训练/推理速度加速最多达10倍,相同硬件可以支持100倍模型,有利于大模型厂商实现降本增效。谈及显卡涨价,展台人士称,H800显卡价格翻倍在业内已是正常现象。
在国内特种计算机领军企业研祥集团的展台,亦有几台AI服务器陈列。展台工作人员告诉记者,“客户可以自购显卡,我们也可以帮客户配,不过现在您可能也了解,英伟达卡的价格比较高。”
(研祥展台的4U10GPU卡异构计算服务器 财联社记者摄)
大模型下半场“卷”什么?
高交会期间的2023西丽湖论坛上,百度创始人、董事长兼首席执行官李彦宏做的一番AI“冷思考”则是近期业内另一大关注焦点。李彦宏直言,中国的大模型太多,而模型之上开发的AI原生应用太少,而国外除了有几十个基础大模型之外,实际上已经有了上千个AI原生应用。
(图源百度官微)
他还表示,自8月31号开放以来,文心大模型的API调用量呈现指数级增长。“国内200多个大模型上了这个榜单、进了那个排名,但其实调用量是很小的,文心大模型一家的调用量比这200多家大模型的调用量加起来还要多。”
“AI原生时代,我们需要100万量级的AI原生应用,但是不需要100个大模型。大模型本身是一个基础底座,类似操作系统,最终开发者要依赖为数不多的大模型来开发出各种各样的原生应用。所以,不断地重复开发基础大模型是对社会资源的极大浪费。”李彦宏表示。
实际上现场不少厂商也认同,李彦宏强调的AI场景落地应用将是大模型下半场的发力方向。高交会期间,科大讯飞(002230.SZ)、英飞拓(002528.SZ)等上市公司集中展示了大模型在城市、数字员工、楼宇、园区等场景的实际应用,南威软件(603636.SH)、拓维信息(002261.SZ)等则与华为共同发布了城市大模型解决方案。
有业内人士告诉财联社记者,AGI时代到来,推理场景和需求增长是必然的。云天励飞-U(688343.SH)展台人士亦称,大模型训练好、成熟之后主要将向落地应用发展,从这个角度可以说接下来推理的市场空间更大。
在云天励飞展台,其国产推理服务器展出。工作人员称,其他搭载英伟达显卡的AI服务器主要是以训练为主,而该服务器用于推理,同时侧重边缘计算。
(云天励飞国产推理服务器 财联社记者摄)
此次,云天励飞亦发布了新一代边缘计算芯片平台DeepEdge10,该芯片为国内首创的国产14nm Chiplet大模型推理芯片,支持大模型推理部署。