①在最新视频中,B2-W机器狗可以完成托马斯全旋、侧空翻、360°跳跃转体、冲跳、极地跑酷。 ②宇树科技创始人CEO王兴兴曾表示,人形机器人(和机器狗)底层原理比较类似,包括关节电机、减速器、传感器、电控系统、控制软件、AI 算法等等。 ③机器人主机厂商已陆续开始出货或加速出货。
发展“新质生产力”正成为我国推动高质量发展的内在要求和重要着力点。2月29日,中共中央政治局会议指出,今年经济工作要坚持稳中求进、以进促稳、先立后破。要大力推进现代化产业体系建设,加快发展新质生产力。
上海张江,作为中国科技创新的重要引擎,以其独特的创新生态和前沿技术,不断孕育出具有划时代意义的新质生产力。
为调研新质生产力的发展成果,张江科学城、财联社、《科创板日报》联合推出“新质生产力看张江”。我们深入一线采访:张江的企业如何创业创新,活力四射;张江的产业如何向“新”而行,提“质”而上。
本期专访企业:上海岩芯数智人工智能科技有限公司(下称:“RockAI”)
RockAI CEO刘凡平
《科创板日报》12月2日讯(记者 张洋洋)在张江人工智能岛上,RockAI是岛内为数不多的从底层架构做起,直接切入大模型赛道的创业公司。但与绝大多数大模型公司们相比,这家初创企业又稍显另类——在技术路径上,其选择了非Transformer架构。
今年1月,RockAI推出了国内首个非Transformer架构、非Attention机制的大模型Yan1.0。9月,这家公司将其大模型迭代至具有多模态能力的Yan1.3模型,还实现了在手机、电脑、机器人、无人机,甚至树莓派等广泛设备端上的无损部署。
谈及走一条非主流的技术路径,RockAI CEO刘凡平坦言在早期外部并不理解为何我们选择了这样一条路。
相较于Transformer架构,非Transformer的Yan模型好处在于,能耗低、成本小、落地周期快。
有过连续创业经历的刘凡平,深刻理解商业的成本投入和价值产出,在现实的商业经营面前,他选择顶住压力,专注走非主流道路。一年多之后,当Yan模型的技术能力,以领先同行的进度,快速落地在如手机、AI PC的产品上的时候,刘凡平才确认,自己扛过来了。
“这趟去深圳,客户和合作伙伴塞了一堆东西给我们,都是在问,可不可以给他们的安卓手机、笔记本电脑都装上大模型。”刘凡平向《科创板日报》记者坦言,“现在的最大压力,反而是快速交付。”
RockAI是上海岩山科技股份有限公司旗下,致力于让世界上每一台设备都拥有自己智能的大模型企业。在这家公司坐落的张江人工智能岛3号楼,周边分布着百度、阿里、IBM、微软等科技巨头。大厂环绕,在刘凡平看来,对于RockAI而言是好事,因为这意味着产业链的集聚。
以百度、阿里和岩芯数智等为代表的大大小小的AI企业集聚于此,这周边已经形成了一个AI生态圈。AI浪潮加速推进,张江人工智能岛,也正成为上海发展人工智能产业高地的重要承载区。
▍让大模型更像“人”
在最近一次的开放日活动中,RockAI正式推出全新升级的Yan1.3大模型,并展示了其在无人机、机器人、PC、手机等各类终端设备上落地能力。
相较于1月份首发的Yan1.0只能处理自然语言,Yan1.3具备了多模态能力,可处理图文及语音等多模态信息,并实现了模型在更广泛设备端上的离线无损部署,普通电脑CPU上也能够流畅运行。
区别于当下多采用的云、边、端协同部署模式,Yan架构大模型能直接部署在设备端,且能够在较小的算力情况下实现较高的性能。
在接受《科创板日报》采访时,岩芯数智CEO刘凡平坦言,从行业叙事看,大部分人工智能从业者所置身的是一场“由OpenAI提出概念,Meta负责开源,国内市场专注应用”的技术接力赛。RockAI不想跟随。
算经济账,Transformer架构的Attention机制,算力耗费高、数据需求大,交付成本也高,成本难以覆盖客户的付费,不少中小型企业望而却步。他们因此在早期就放弃了基于Attention机制的Transformer架构大模型。
最近的面试,刘凡平说自己会经常问候选人一个问题:如果有一天你要离开这个世界,你希望在自己的墓志铭上写什么?
他称,对多数人而言,这是一个需要思考超过30秒甚至更长时间的问题,但是在Transformer机制下,大模型会马上输出答案。
“这是Transformer大模型与人类大脑工作机制的不同,人类回答输出的时间会根据问题的复杂程度变化,复杂问题求解时参与的神经元变多了,所以输出时间会变长。但现在的大模型在面对这个问题时,即使是很复杂的问题,它的输出速度是一样的。”
本质来说,刘凡平认为大模型应当模拟人脑的方式来工作,而不应该是Transformer架构大模型中那样无时间差别的输出。也是刘凡平和他的团队放弃Transformer架构,选择自研架构的一大原因。
刘凡平说RockAI的愿景,是让世界上每一台设备都拥有自己的智能,同时通过群体智能实现通用人工智能。他期望大模型更像人,自研的Yan模型,是群体智能单元大模型,它会则更注重模拟人脑的工作机制,通过多个智能单元的协作和交互,形成的集体智慧和决策能力,能够具备超越单元个体的能力。
在RockAI的规划中,群体智能的实现包括四个阶段:创新性基础架构、多元化硬件生态、自适应智能进化、协同化群体智能。目前,Yan1.3已经可以在广泛的设备上部署和应用,进入到了多元化硬件生态,下一阶段是自主学习。据刘凡平透露,Yan2.0计划在明年发布。
▍让AI落地端侧
刘凡平是中国科学技术大学计算机专业,科班出身,研究生生涯一半时间在微软度过,毕业后进入百度。从大厂出走后的第一次创业,就是搜索引擎,放在当下的生成式AI语境下,这就是ChatGPT的雏形版。
早期的求学和后来的工作经历,刘凡平一直与人工智能打交道。作为这个行业的连续创业者,他对完善的、能快速奏效的商业闭环,有着异乎常人的关注。这一方面是连续创业经验带来的条件反射,同时也是在烧钱的AI行业里避坑。
商业闭环对应的是应用落地。过去两年,大模型,尤其是基础模型的技术进步,日新月异,但其中也有不少质疑的声音,技术发展这么快,真正的落地应用在哪里?今年,行业的讨论集中在了大模型的应用上。
刘凡平告诉《科创板日报》记者,RockAI的策略是,快速推进Yan模型在更广泛的终端落地应用。
从行业发展方向来看,大模型落地设备端是一个明显的趋势。在设备端的场景,国内多个厂商已在抢占生态位,手机端目前最受市场关注,尤其是苹果AI的发布,带动了AI手机的资本热潮。
类似于手机的大范围应用,一个技术产品要触达最广泛的用户,需要靠设备,它可以是监控的设备,也可以是家里的设备,也可以是办公场景的设备,设备才是真正毛细血管,触达到千千万万的用户。
对于目前的市场竞争形势,刘凡平表示,硬件更新周期长,比如手机的更新是一年一次,这里就留下了足够长的时间窗口去和设备厂商做适配。且某个大模型的一旦占据了某个设备型号,其他厂商并不容易替换,要么就等下一次的新机型。硬件厂商选择供应商也十分谨慎,从实际落地上来说,设备更容易形成壁垒。
在近期的开放日现场,RockAI重点展出了Yan1.3在机器人、PC、手机、无人机等各类终端设备上的落地。例如,飞龙无人机能在设备端实时处理声音、图像及文字等模态信息,无需经由云端处理判定再发回设备端执行;胖虎机器人可在离线的情况下理解模糊指令,展现“七步成诗”、“咏春拳法”等;在PC上的迅兔智能助手可以在离线模式下听懂语音指令、看懂图片并快速搜图。
据刘凡平透露,目前RockAI已在机器人和AI PC、手机等产品上具备交付能力。
刘凡平认为,在AGI这个终极命题下,无论是云端还是端侧,都只是实现智能普惠及跃迁的一个载体。他始终坚信,只有真正提升每一台设备的自我学习能力,才能激发更高级别智能形态即群体智能的涌现。
▍离开又回到张江
刘凡平是后来带着独立创业的RockAI回到张江的。在此之前,他在当地的上市公司岩山科技履职。目前,RockAI已经是岩山科技独立的人工智能业务板块。
之所以继续回到张江发展,既有前东家的邀约,也有当地产业链的集聚效应吸引。
RockAI现在坐落于张江人工智能岛3号楼,周边分布着百度、阿里、IBM、微软等科技巨头。这附近,也是上海发展人工智能产业高地的重要承载区。
刘凡平表示,产业上的大厂环绕,一定程度上可以链接更多合作伙伴。RockAI目前被视为张江重点人工智能企业,当地政府也给予了诸多支持。今年元旦前后,RockAI就将搬入张江的大模型产业生态集聚区“模力社区”,这些场地,当地也给予了场地租金的优惠支持。
AI行业未来面临的星辰大海和公司当下快速的发展线轴,为刘凡平的创业增添不少信心。RockAI岩芯数智目前的团队规模约为50人,但交付跟不上,也困扰着他。
“其实现在我们也需要去扩大团队规模,尤其是市场团队、交付团队,这块的建设可能会投入更多,此外还会再在技术研发上继续做投入。”他说。