当前位置: 首页 > 金融 >

【热闻】物理AI时代核心“卖铲人”:数据采集是机器人下一个风口?

来源:华尔街见闻官方 2026-05-08 17:08:59

人工智能的底层逻辑正从大语言模型的“语言理解”转向世界模型的“预测世界”。在这一跃迁中,物理数据的质量与采集能力成为发展核心。作为解决世界模型与具身智能“数据燃料”问题的关键,具身数据采集正开启下一代数据基建浪潮。

国泰海通最新报告指出,具身智能发展的最大障碍已不再是算法,而是数据缺口。其对数据的需求量呈指数级膨胀,远超传统AI模型。在这一背景下,能够率先填补数据缺口的数据供应商与基础设施商,将作为物理AI时代的“卖铲人”,占据产业链核心价值节点,有望享受显著的估值溢价。


(资料图)

技术路线上,真实数据、仿真/合成数据、视频数据各有利弊:纯真实数据成本过高,纯仿真数据存在“Sim2Real”(仿真到现实)鸿沟。未来主流路径逐渐清晰:仿真/视频数据用于大规模预训练 + 真实数据用于微调与强化学习。

随着主流技术路线日渐清晰,资本正加速涌入数据采集工具链(动捕、遥操作)、视频数据升维平台及仿真训练场——这些数据采集基础设施,正成为机器人产业真正的风口与“铲子”生意。

范式转移:世界模型重塑AI基石,数据需求膨胀至EB级

AI正从“数据相关性”驱动转向“物理因果性”驱动,2025年已成为世界模型应用落地的元年。具身智能对数据的需求量及复杂度正呈指数级爆发。

传统神经网络与大语言模型本质上依赖模式识别与概率关联,而“世界模型”的核心在于内建物理规律(如重力、惯性),并具备预测时空演化的能力。自2025年起,该领域迎来集中突破:Meta的V-JEPA 2、谷歌的Genie、OpenAI的Sora以及World Labs的RTFM相继问世。

世界模型将赋能游戏、自动驾驶与具身智能三大核心场景。其中,具身智能的爆发对数据提出了前所未有的苛刻要求。与大语言模型及自动驾驶(PB级数据量、以文本或视觉为主)不同,具身智能需适应形态各异的硬件平台,数据需求高达EB级,且极度强调物理交互(力觉、触觉、关节反馈)。目前行业仍处早期阶段,预训练数据极度紧缺,“数据孤岛”与异构数据融合难题已成为制约产业爆发的核心瓶颈。

三大主流数据采集方案利弊共存,视频数据成为业内关注新焦点

构建高效的数据闭环,是具身智能能力跃升的核心。当前,资本与技术主要围绕三大数据采集方案展开:

  • 真实数据(高保真但极度昂贵):通过遥操作、穿戴式动捕等方式直接采集。优势在于不存在Sim2Real差距;致命短板是成本高、扩展性差,难以覆盖长尾边缘场景。

  • 合成/仿真数据(高性价比但存在迁移鸿沟):利用物理引擎在虚拟环境中生成。成本极低且自带完美标签,但面临显著的“Sim2Real Gap”(动力学、感知、控制等差异),导致模型在真实环境中性能衰减。

  • 视频数据(来源广但直接应用难):业内新兴焦点,通过升维技术利用海量互联网视频。成本低、规模大,但缺乏物理交互属性(如重力、摩擦力),噪声大且缺少精确的三维标注。

产业演进趋势:Generalist AI的GEN-0模型(≥7B参数)已证明,在海量真实交互数据下,模型性能呈幂律增长。在真实数据成本被彻底打下来之前,“仿真/视频数据预训练 + 真实数据微调/强化学习”的虚实结合方案将是绝对主流。

与此同时,底层数据基建正在国家力量与开源生态的推动下加速成型:上海落地了全国首个具身智能领域国家级标准化试点(“1+N”模式训练场),北京建立了首个基于真实场景的数据训练基地。谷歌、星海图、傅利叶、智元等纷纷发布开源数据集,中国信通院则牵头制定了国内首个具身智能数据集质量评价标准。

机器人本体厂商的“数据站队”与战略分化

正是由于真实数据成本高、仿真数据存在迁移鸿沟、视频数据噪声大,国内外主流机器人本体厂商在数据路线上出现了明显分化。这一分化,反过来为数据采集基建的方向提供了最直接的产业验证。

  • 真实数据优先派:认为只有真实交互才能跨越Sim2Real鸿沟。智元机器人在大模型训练阶段100%使用真机真实数据,仿真仅用于工程迭代;自变量机器人在复杂物理交互场景中完全不使用仿真数据;1X Technologies同样将“大规模真实世界数据”作为核心壁垒。

  • 合成与仿真数据优先派:押注成本与规模。银河通用采用99%的合成数据配以1%的真实数据进行训练,试图以极低成本逼近真实分布。

  • 视频数据战略高地:特斯拉、Figure AI等巨头正加速布局,核心逻辑在于互联网视频规模远超任何单一机器人平台能采集的真实数据。特斯拉Optimus已放弃早期动捕与遥操作,转向深挖互联网视频;千寻智能Spirit v1的70%预训练来自互联网视频;Figure AI启动Project Go-Big,探索人类视频到机器人的零样本迁移;星动纪元、逐际动力则分别采用“视频预训练+真机微调”及多源数据组合策略。

这三条路线的并存恰恰说明:当前尚无单一数据来源能独立解决具身智能的数据瓶颈。无论最终哪条路线收敛,数据采集工具链、仿真平台与视频升维技术——即物理AI时代的“卖铲人”——都将是确定性受益的方向。

数据“卖铲人”全景图

随着具身智能对数据的需求量级与复杂度指数级上升,能够有效解决数据获取成本与效率问题的供应商,正迎来一轮估值重估。这一重估覆盖四个关键方向:视频数据转化、仿真平台、多模态硬件采集,以及综合数据服务。

  • 视频数据转化方向:核心突破在于将海量互联网视频低成本转化为机器人可用的训练数据,部分方案已能将综合采集成本降至行业平均水平的千分之五以下。

  • 仿真平台方向:全链路合成数据体系以极低成本生成带完美标注的大规模虚拟数据,并逐步缩小Sim2Real差距。

  • 真实数据采集硬件方向:光惯融合手套、电子皮肤等传感器结合高质量开源数据集,正在构建高保真底座。

  • 真实数据生态与遥操作方向:大规模自建采集场景与高精度遥操作设备,已成为主流微调数据的重要来源。

在二级市场视角下,综合性数据服务商通过多元方案(遥操作、动捕、合成数据)建设具身智能数据训练场与工程化平台;仿真平台公司则通过收购整合打通虚实数据壁垒,提供全生命周期物理AI解决方案。

整体来看,无论是视频转化、仿真生成、硬件采集还是综合服务,能够显著提升数据“可获得性”与“成本效率”的供应商,正在从产业边缘走向估值中枢。

相关阅读

关键词: 机器人 多模态 数据采集

大家还在看
【调研快报】康华生物接待宏利基金等2家机构调研
【调研快报】康华生物接待宏利基金等2家机构调研
美股异动 | 英伟达(NVDA.US)盘中快速拉升现涨近4% 总市值重新站上5万亿美元
美股异动 | 英伟达(NVDA.US)盘中快速拉升现涨近4%
阿里云:4月30日10:00起 Qoder Teams版新购价格调整为300RMB/席位月
阿里云:4月30日10:00起 Qoder Teams版新购价格调
视焦点讯!渤海汇金多元积极配置3个月持有期混合延长募集期
视焦点讯!渤海汇金多元积极配置3个月持有期混合延
每日报道:PriceSeek提醒:河南凯捷活性炭报价上涨
每日报道:PriceSeek提醒:河南凯捷活性炭报价上涨
每日热议!两融余额连续12个交易日增加,证券ETF华夏(515010)跌超1%,盘中持续小幅溢价
每日热议!两融余额连续12个交易日增加,证券ETF华夏
每日动态!海南德润兴业建材有限公司成立 注册资本100万人民币
每日动态!海南德润兴业建材有限公司成立 注册资本1
最高法发布二〇二五年人民法院知识产权典型案例——依法严惩“网络黑嘴”商业诋毁
最高法发布二〇二五年人民法院知识产权典型案例——
高股息方向逆势走强,红利低波ETF易方达(563020)获资金连续布局
高股息方向逆势走强,红利低波ETF易方达(563020)
霍尔木兹海峡19日无船舶通行记录
霍尔木兹海峡19日无船舶通行记录
冷空气要来了 安徽未来几天气温骤降,江南局地有大雨
冷空气要来了 安徽未来几天气温骤降,江南局地有大
东吴证券:云涨价周期刚刚开始
东吴证券:云涨价周期刚刚开始
成都俊旺楚钦食品有限公司成立 注册资本100万人民币|焦点关注
成都俊旺楚钦食品有限公司成立 注册资本100万人民
热点追踪|从消博会展区之变,看消费趋势之变|每日看点
热点追踪|从消博会展区之变,看消费趋势之变|每日
阿拉伯胶商品报价动态(2026-04-13) 焦点快看
阿拉伯胶商品报价动态(2026-04-13) 焦点快看
【聚看点】视频|小男孩坐过站迷路,公交驾驶员护其安全回家
【聚看点】视频|小男孩坐过站迷路,公交驾驶员护其
每日视点!对阵皇马进球,凯恩在欧冠赛场首次在禁区外破门
每日视点!对阵皇马进球,凯恩在欧冠赛场首次在禁区
赏花游热度飙升 武铁计划增开214列始发客车_每日看点
赏花游热度飙升 武铁计划增开214列始发客车_每日看点
看点:南京崇正书院木绣球花开如雪 入画“品”花正当时
看点:南京崇正书院木绣球花开如雪 入画“品”花正
每日报道:亚通股份对全资子公司亚申数维增资3200万元
每日报道:亚通股份对全资子公司亚申数维增资3200万
新动态:@家长 如何远离家庭干预三大常见误区|世界提高自闭症意识日
新动态:@家长 如何远离家庭干预三大常见误区|世
惨败湖人中难得的亮点,奇才锋线新星的水平不比他的马刺兄弟差?
惨败湖人中难得的亮点,奇才锋线新星的水平不比他的
焦点资讯:朗新科技2025年净利润 1.05 亿元 董事会秘书王慎勇薪酬72万
焦点资讯:朗新科技2025年净利润 1.05 亿元 董事
佛山市安珀新材料有限公司成立 注册资本50万人民币
佛山市安珀新材料有限公司成立 注册资本50万人民币
今日讯!信披规则优化 夯实公募高质量发展根基
今日讯!信披规则优化 夯实公募高质量发展根基
邢台泽乔机械制造有限公司成立 注册资本30万人民币 焦点观察
邢台泽乔机械制造有限公司成立 注册资本30万人民币
词元概念发酵 算力服务股大涨_每日信息
词元概念发酵 算力服务股大涨_每日信息
精细化精准服务赛事 滴滴青桔全力护航2026无锡马拉松 今亮点
精细化精准服务赛事 滴滴青桔全力护航2026无锡马拉
PriceSeek重点提醒:华东金属硅553#价格上调|时快讯
PriceSeek重点提醒:华东金属硅553#价格上调|时快讯
合成橡胶:中东紧张局势引致原料供应预期下滑,BR强势上涨
合成橡胶:中东紧张局势引致原料供应预期下滑,BR强
京东外卖汤圆订单增长超10倍
京东外卖汤圆订单增长超10倍
大行评级丨花旗:上调创科实业目标价至150港元,维持“买入”评级
大行评级丨花旗:上调创科实业目标价至150港元,维
3月2日招商中证科创创业50ETF基金份额减少1500万份,重仓股中际旭创、新易盛、宁德时代_即时
3月2日招商中证科创创业50ETF基金份额减少1500万份
焦点资讯:张本智和苦笑 在新加坡遭遇客场:全场观众在为对手加油 耻辱一败
焦点资讯:张本智和苦笑 在新加坡遭遇客场:全场观
雷军:新一代小米SU7内置机械结构,可电动也可以机械打开
雷军:新一代小米SU7内置机械结构,可电动也可以机
每日报道:火箭队迎战克星,阿门缺阵防守下滑,12+3射手上位,启用第三后卫
每日报道:火箭队迎战克星,阿门缺阵防守下滑,12+3
每日看点!升能集团完成配售合共2.28亿股配售股份
每日看点!升能集团完成配售合共2.28亿股配售股份
2026年春节档总票房破43亿元|热文
2026年春节档总票房破43亿元|热文
【独家】就这还像文班?珀金勇士首秀12分低位能力全无 科尔狂夸被打脸
【独家】就这还像文班?珀金勇士首秀12分低位能力全
宏利金融-S(00945)启动“常规发行人要约”计划 拟回购并注销最多达4200万股普通股
宏利金融-S(00945)启动“常规发行人要约”计划 拟
武胜关下民辅警保畅通——寒风中一站就是3个多小时|简讯
武胜关下民辅警保畅通——寒风中一站就是3个多小时|
平乐:古榕桂韵年味足_每日资讯
平乐:古榕桂韵年味足_每日资讯
快讯:湖南天雁:2月13日获融资买入181.50万元
快讯:湖南天雁:2月13日获融资买入181.50万元
每日视点!无忧传媒CEO雷彬艺:年轻人不是非得当网红 但应该懂新媒体
每日视点!无忧传媒CEO雷彬艺:年轻人不是非得当网红
焦点热讯:各地果蔬年货市场货足价稳 “菜篮子”新春保供“不断档”
焦点热讯:各地果蔬年货市场货足价稳 “菜篮子”新
今日聚焦!PriceSeek重点提醒:2025棉花检验量同比大增
今日聚焦!PriceSeek重点提醒:2025棉花检验量同比大增
韩国投资者再度扫货中国股票 大举买入大模型龙头MiniMax-WP
韩国投资者再度扫货中国股票 大举买入大模型龙头Mi
北京人形机器人创新中心发布具身天工3.0 核心目标“更开放、更好用” 实时
北京人形机器人创新中心发布具身天工3.0 核心目标
焦点资讯:生意社:2月10日浙江巨化无水氟化氢价格动态
焦点资讯:生意社:2月10日浙江巨化无水氟化氢价格
视讯!宁德时代、长安汽车合资公司成立新动力电池公司 注册资本10亿
视讯!宁德时代、长安汽车合资公司成立新动力电池公
库里因伤缺战湖人!回应勇士追字母哥失败 正为波神学拉脱维亚语
库里因伤缺战湖人!回应勇士追字母哥失败 正为波神
服务区里养鱼?记者带你打卡武黄高速上的湖北文化地标!-快看
服务区里养鱼?记者带你打卡武黄高速上的湖北文化地
小杨阿姨已回老家过年,玥儿箖箖姐弟没被邀请参加亲妈周年祭
小杨阿姨已回老家过年,玥儿箖箖姐弟没被邀请参加亲
人民币汇率从32个月高点回落,央行中间价释放维稳信号——美元/人民币中间价6.9695
人民币汇率从32个月高点回落,央行中间价释放维稳信
《中国奇谭》艺术展开启“入梦”之旅 东方美学走进现实_焦点快看
《中国奇谭》艺术展开启“入梦”之旅 东方美学走进
线上线下:预计2025年度净利润亏损700万元~1000万元|快消息
线上线下:预计2025年度净利润亏损700万元~1000万元
焦点日报:韩束披露用户规模突破1亿,下一步打造多品类
焦点日报:韩束披露用户规模突破1亿,下一步打造多品
2026年第一批转行的网约车司机出现了,有人一天收入破千
2026年第一批转行的网约车司机出现了,有人一天收入
长源东谷获乘用车新客户定点函 今日热讯
长源东谷获乘用车新客户定点函 今日热讯
观焦点:腾讯混元发布混元图像3.0图生图模型
观焦点:腾讯混元发布混元图像3.0图生图模型
热词