①在将机器人关键零部件业务定位为未来的战略业务后,福达股份欲在华东地区建立“第二总部”; ②未来公司计划把机器人业务、曲轴业务以及新能源电驱齿轮等业务都尽可能往华东扩展; ③目前业内送样工作已不稀奇,更值得关注的是中试线量产情况和订单获取情况。
《科创板日报》5月26日讯(记者 黄心怡)“左右勾拳、侧踢、膝踢、闪避、跌倒起身,被KO……”一场机器人之间的格斗比赛在昨晚开打。
在这场于杭州举行的《CMG世界机器人大赛·系列赛》机甲格斗擂台赛上,宇树科技以合作方身份参赛,上场的机器人均为宇树 G1人形机器人,并进行现场的手柄操控。经过几轮比拼,黑队"AI策算师"最终夺得冠军。
“这次比赛的格斗动作,采集自外部专业人员,用来给AI模型提供学习参考。”宇树科技相关负责人向《科创板日报》介绍。
在此次比赛过程中,机器人暴露了仍存在动态控制、感知不足等问题,也展现出较强的平衡控制、人机协同能力。
多名业内人士对《科创板日报》表示,从格斗过程来看,机器人底层算法已经较为出色,但缺少真正的空间智能大模型作为机器人的大脑。为了更好地在实际应用落地,后续产业链或将涌现更多二次开发的机器人解决方案商,在公版机器人基础上开发专业的大脑。
▍拳脚相加!机器人遭重击后5秒起身
《科创板日报》注意到,在相互出拳、踢腿的格斗过程中,参赛机器人能通过步伐的调整来保持自身的平衡。在被击中后,机器人也能迅速起身。“虽然格斗效果一般,摔倒爬起来的灵活性把我惊呆了,支撑力拉满。”有观众表示。
“机器人倒地五秒内马上能起来,重心不稳的情况下能调整身形维持平衡,这两点让我印象较为深刻。” 快思慢想研究院院长、上海交通大学计算法学与AI伦理研究中心联席主任田丰表示,“两足机器人的动态平衡性要比四足难得多。机器狗的重心只需要落在4个脚组成的矩形内就行,支撑的面积大。而两足人形机器人的重心需要落在两足的连线内。”
据悉,宇树G1机器人在对抗中保持平衡,主要依赖于仿真环境的AI强化学习和本体关节的感知。通过对大量平衡数据的学习和模拟训练,机器人不断优化自身的平衡控制策略,同时本体关节的高精度传感器能够实时感知身体各部位的姿态和受力情况,为平衡控制提供关键数据。
宇树科技相关负责人向《科创板日报》介绍,IMU(惯性测量单元)在机器人保持平衡中发挥着重要作用,在仿真训练中同样不可或缺。IMU可以实时监测机器人的姿态、加速度等信息。
值得一提的是,此次参赛的宇树科技G1手臂进行了定制化设计,拥有7个自由度,比常规的5个自由度多出两个,目的是在格斗中进行更灵活的招式变化,如勾拳、摆拳、上勾拳等拳击动作中的手腕调整,增加攻击的角度和灵活性。
上述人员介绍,G1格斗模式的训练难度一是在于瞬间爆发力要求高,需要机器人具备强大的动力系统来提供足够的扭矩,以实现快速动作响应。二是对控制算法精准度和稳定性要求高,控制算法要实时处理大量传感器数据,精确计算身体各部位的运动轨迹与发力时机,实现对多关节、重心、姿态毫秒级的精准控制,保证动作既有力又不失协调。三是机械结构强度要求高,在进行该动作时,机器人的机械结构需要承受较大的冲击力,对关节、骨骼等结构的强度和稳定性提出了很高的要求。
▍人机协同为主,操作员手柄遥控机器人对战
G1机器人操控方式包括AI语音操控、手柄操控、体感操控,各有优缺点。而本次比赛中主要采用现场人员进行手柄操作的方式。在比赛过程中,可以看到操作员在一旁控制机器人进行格斗。
宇树科技相关负责人对此解释道,AI语音操控响应延迟比较明显,影响对机器人的实时控制。手柄操控让参赛者更直观、更精准地操控机器人,也更易于上手,有利于扩大参赛者范围。而体感操控在沉浸感上更具潜力,宇树已经开发了一套体感人形机器人控制系统,后续的比赛应该就可以给参赛者使用。
中国信通院泰尔系统实验室副总工程师刘泰介绍,对机器人进行手柄操控,与日常普通的遥控玩具,存在一定的区别。人形机器人其背后是一整套的大模型、运动控制模型的算法支撑,实际上是在通过这些算法来进行操控。
“采用传统的控制方法很难让它站得住走得稳,现在通过强化学习的训练方式,让它往能够站得平衡的方式由自己去探索。整体的比赛非常振奋,它的表现可以说比以往更进了一步,能够看到机器人在对抗比较强的情况下,也能够保持很好的稳定性,包括全身的运动机构协调,是科技进步和产业进步很好的结合。” 刘泰提到。
田丰认为,“在暂时还不能实现通用人工智能AGI的前提下,能否通过人机协同来达到比较好的效果,是当前业内探索的方向。而这场比赛也展现了一定的成果,这也是很有价值的。”
▍实时感知仍存困境 机器人大脑待突破
不过,由人类遥控操作的机器人也存在比赛失误的情况。比如选择主动攻击对手,不当心扑空后,导致参赛机器人失去稳定性倒地,被对手“KO”。机器人想要后退来调整对战角度,却意外被擂台的围绳给缠住,需要人类来解绑等等。这其实暴露了机器人动态运动控制与实时感知的不足。
“这就涉及到一个问题,机器人是否要完成仿真人类的形态。比如人背后没有长眼睛,但机器人后背是否应该设置摄像头,让机器人扩大感知范围。再比如人只有5个手指,但有些工业场景可能6个手指会更好。人形机器人可能只是一个过渡阶段,未来可能会发展出超越人形的机器人形态。” 田丰表示。
一名观赛的业内人士认为,从格斗过程来看,底层算法已经较为出色,包括稳定性、视觉、灵活性、速度连贯性等,目前缺少的是真正的空间智能大模型作为机器人的大脑。
田丰表示,从中美来看,在机器人大脑的投入是美国的比例更大些。“国内企业大部分都在做机器人本体,有一些机器人企业在做小脑,也就是运动控制系统。做机器人大脑的企业大概在1/20的比例。不过,已经有一些机器人企业正在进行大脑研发。”
从产业链来看,田丰认为业内更多的关注焦点在于整机厂商,以及电机等硬件层面,而大脑也是通用型的基础性大脑。“但机器人整机其实需要软件二次开发,才能更好地在实际应用。比如面向格斗、工厂、物流等场景进行二次开发。后续产业链会涌现这类的机器人解决方案商,在公版机器人基础上开发专业的大脑。这就涉及到多模态大模型,以及RAG知识库进行融合。”