
①当下具身发展的核心瓶颈就是数据。**高质量数据的规模化生产能力,就是这个赛道的"石油";②简智机器人联合创始人朱雁鸣表示,数据是模型成长必需的养料,因此会比模型更早迎来规模化时刻。
《科创板日报》6月7日讯(记者 李明明)当人形机器人整机赛道的热度仍在持续,资本的目光已悄然投向产业链上游的核心基础设施——具身数据。
近期,以简智机器人为代表的专业数据服务商完成数亿元级融资,成为“无本体数据”赛道融资额最高的企业;另一边,硬件起家的帕西尼依托自研灵巧手传感器与自建实体数据工厂。
而在刚刚过去的2026年5月至6月初,这一赛道再度升温:鹿明机器人、光轮智能、核数聚接连完成大额融资;国家数据局局长公开定调“以数据工程驱动具身智能”;英伟达正式推出人形机器人参考设计,打通“数据-仿真-部署”全链条。这场“数据热”已不再是孤立的资本故事,而是技术瓶颈、政策红利与产业巨头共同推动的结构性拐点。
这轮热潮究竟是短期炒作,还是产业演化的必然?在技术路线分化、跨界玩家涌入的当下,真正的护城河又在哪里?
为了寻求答案,《科创板日报》记者采访了多名具身智能领域资深投资人与产业人士。
“数据饥荒”下的刚性需求:从单点融资到密集爆发
投资出智平方、跨维智能、松延动力等知名具身智能项目的清智资本及清智孵化器负责人张煜,对《科创板日报》记者明确指出:“具身数据有着特殊的技术要求,现有民用数据无法复用。例如抓取水杯,机器人无法自主判断握持力度,极易滑落。高精度、第一视角、多维度的具身数据极度稀缺。”
“这轮融资的本质驱动力是真实需求,不是资本追热。”投资出诺亦腾等热门具身智能项目的阿尔法公社合伙人刘罡对《科创板日报》记表示。
他所指的“真实需求”,是当前具身智能行业普遍面临的 “数据饥荒” 。与传统大语言模型可利用互联网海量文本不同,具身智能模型训练极度依赖包含视觉、力觉、动作轨迹、物理交互结果的“多模态物理数据”。这类数据此前几乎为零。
这种短缺的量化对比触目惊心。刘罡提供了一个关键参照:“以DeepSeek-V4-Pro为参照,其预训练使用了约33万亿Token;而目前全球最大的真实机器人数据集Open X-Embodiment,也仅有百万级别的真实机器人轨迹。所以当下具身发展的核心瓶颈就是数据。高质量数据的规模化生产能力,就是这个赛道的"石油"。”
供需失衡之下,数据服务商便成了具身智能产业链上那个“卖铲子”的确定性角色。张煜分析称:“具身赛道内多数企业尚未盈利,但所有玩家都必须采购数据。数据采集设备门槛适中、整体偏向轻资产模式,数据企业现金流稳定,盈利确定性更强。AI数据产业,特别是具身数据行业,未来可能成为新质生产力基础设施,规模可达万亿级别。”
而就在近期,这一逻辑被数起新融资案进一步验证。
6月1日,简智机器人宣布完成连续多轮共数亿元融资,分别由蚂蚁集团、滴滴、德联资本领投,累计金额位居“无本体数据”赛道首位。其联合创始人朱雁鸣向《科创板日报》记者表示,“当时我们有两个方向,一是做可泛化的通用大模型;二是数据,一个判断是,数据是模型成长必需的养料,因此会比模型更早迎来规模化时刻。”
同一日,光轮智能宣布完成新一轮融资,该公司专注于物理AI数据与仿真基础设施。
5月,鹿明机器人宣布,连续完成A1及A2两轮融资。两轮融资完成后,公司累计融资近10亿元。公司致力于推动机器人在落地过程中形成更大规模的真机数据回流,从而启动通向通用智能的数据飞轮。
投资出他山科技等知名具身智能项目的水木资本董事长唐劲草对《科创板日报》记者评价:“简智这轮数亿元融资,标志着市场开始给数据底座重新定价,也反映投资者对数据资产战略稀缺性的认知。这种热度不是短期炒作,而是技术瓶颈和场景需求叠加的必然结果。”
产业资本领跑,“铁三角”成最优解
在这一波数据投资潮中,资金的来源与结构并非均匀分布。三位投资人均观察到,产业资本的推进速度与参与力度远超其他资本。
“产业资本本身深耕实体产业,自身就存在明确的数据应用需求,投资目的性极强。”张煜指出,产业资本不仅能提供资金,更能开放物流、电商、制造等真实应用场景,形成“场景+资本”的双轮驱动。
相比之下,政府背景基金决策流程更长,偏好成熟头部企业;市场化VC则更倾向布局轻量化的早期项目。值得注意的是,光轮智能此轮引入了建投投资、大湾区共同家园基金等国资,体现出政府资金也开始有节奏地进入数据基建领域。
对于企业长期发展而言,多位投资人一致认为最优的资金结构是"政府资金+产业资本+市场化VC"的"铁三角"组合。刘罡解释道:"政府资金做底座——提供长线耐心资本、基础设施支持和政策协同;产业资本做场景——提供真实落地环境,帮助企业跑通从数据采集到模型验证的闭环;市场化VC做加速——押注团队的技术壁垒和规模化能力,提供商业化视角和灵活战略支持。"
唐劲草补充说,单一依赖某类资金容易出现短期化扩张或战略受限问题。比如只靠VC可能过度追求规模,而政府资金可能受审批周期影响,导致迭代不及时。合理的资金组合既兼顾资金耐心,又能保证落地能力和市场化导向。
技术路线分化:混合数据闭环成投资人共识
在技术路径上,当前具身数据领域呈现“群雄逐鹿”之势:合成数据、遥操作采集、动作捕捉复用、无本体数据采集、实体数据工厂等路线并存。资本究竟更青睐哪一条?
"现阶段不应押注单一路线,而应看团队能否构建混合数据闭环。"刘罡表示,更看好能构建混合闭环的企业:用仿真数据覆盖基础任务和长尾扰动,用真实机器人数据校准动作策略,用第一视角EGO数据提取和补充人类意图、手部轨迹及子目标信息,最后通过商业落地形成数据回流。
唐劲草也认为,投资人更看重"高质量大规模训练数据闭环"模式,也就是把遥操作采集和自建数据工厂结合起来。他指出,核心壁垒其实有三点:数据规模、数据质量和商业闭环能力。如果企业能做成这个闭环,那它在融资和市场上就有长期护城河。
关于核心壁垒的演变,刘罡提出了三阶段论:初期看质量,中期看规模化能力,终局看商业闭环。"现在全行业都缺高质量的'牛奶数据'——低噪声、强标注、可直接进入训练管线的数据。但真正的长期壁垒不在于能雇多少人采数据,而在于能否建成一套机器人数据引擎,把多模态信息清洗、对齐、标准化,转成模型可持续利用的训练表示。"
在技术路线分化的同时,行业也涌现出两种典型的商业模式。一种是以简智机器人聚焦的专业数据商模式,专注于数据采集、处理和标准化,为下游模型训练提供服务;另一种是以帕西尼等为代表的"由硬入软,以硬件壁垒定义数据产权"的模式。
对于类似帕西尼的模式,唐劲草认为是积极可行的,但复制难度不小。硬件起家保证了数据采集的标准化和可控性,同时形成了数据产权壁垒。但这种模式不仅要求传感器和制造能力,还需要工厂运营经验、场景资源和充足资本。主要风险包括重资产投入高、本体迭代后历史数据映射问题以及运营成本和技术维护压力大。
张煜也指出,类似帕西尼模式可复制性较低。该企业同时布局机器人本体、传感硬件、动作捕捉设备、数据采集全链条,形成完整商业闭环。但行业分工高度专业化,多数企业缺少底层硬件与材料积累,贸然跨界全链条布局,反而会导致每个环节都缺乏核心竞争力。
而鹿明机器人则走出了第三条路径——"无本体数采+产业落地"。鹿明机器人高管在接受《科创板日报》记者采访时表示,公司在苏州、湖州等地建有多个无本体数据采集及训练中心,并且能够将一整套数采场建设解决方案售卖给客户。随着具身智能行业对于数据需求量的持续扩大,无本体数采方案的数据采集成本更低、采集效率更高逐渐成为行业共识。这种数据采集方式不依赖特定的机器人硬件或本体,采集到的数据是"与机器人解耦"的,可以灵活迁移到不同机器人上使用。
"在鹿明看来,具身数据的决胜点在于,能否在真实产业场景中规模化沉淀高质量操作数据。"该高管表示,鹿明将工业场景作为具身智能价值落地的关键出口之一。持续加强与产业方的深度合作,将技术能力嵌入真实生产体系,在落地的过程中形成更大规模的真机数据回流,从而启动通向通用智能的数据飞轮。目前,鹿明已与三菱电机、中远海运、德马科技、广运集团等产业方展开深度合作。
大厂入局催生行业分工:独立数据平台仍有生存空间
随着机器人本体公司、智驾跨界玩家甚至互联网平台都开始自产具身数据,市场对独立数据平台的生存空间产生了担忧。多位受访人士表示,大厂入场一定会冲击低壁垒的数据采集商,但独立数据平台的需求不会消失,更可能的结果是倒逼出更清晰的行业分工。
刘罡认为,可以类比自动驾驶行业的演化:主机厂和Robotaxi公司通常自主管理核心路测和运营数据,但部分数据标注、质检、长尾数据采集与合成以及数据工具链,仍由专业服务商承接。具身智能大概率也会走向类似分工。
“长期来看,不同厂商的传感器配置、自由度、末端执行器、动作空间和控制频率都存在结构性差异,跨平台数据复用是个硬问题,这反而给了独立第三方平台真正的机会——把不同本体、不同场景、不同模型之间的数据对齐和标准化做起来,成为行业的数据中间层。” 刘罡说。
唐劲草也表示,“当机器人本体企业、智驾跨界玩家、互联网平台开始自产具身数据时,我会重点看它们有没有稀缺场景和可标准化数据能力。“从长期来看,行业更可能形成分工:头部企业自产核心数据,独立平台提供跨场景、长尾任务和可交易数据。这种模式不仅保留独立平台生存空间,也推动整个具身智能行业的数据资产流通和价值释放。
张煜则参考算力行业的发展规律指出,大量非专业企业跟风入局后,最终多数会因缺乏行业认知、运维能力不足逐步退出,仅留存专业头部企业。行业未来将形成分层格局:专业领域、工业垂直场景由专业头部数据企业、深耕行业的巨头主导;通用场景、民用娱乐场景门槛相对较低,机器人本体厂商、中小创业者、跨界企业均可参与。
“简言之,跨界玩家会在通用低端场景分走部分市场,但工业、专业等高价值领域,仍将由传统专业数据企业把控。” 张煜说。