切换到宽版
  • 48阅读
  • 2回复

[智能应用]宇树智元机器人在进博会“隔空对话”:王兴兴有困惑,稚晖君有解法 [复制链接]

上一主题 下一主题
在线姜谷粉丝

UID: 1569053

精华: 2
级别: 玉清道君
 

发帖
163487
金币
450376
道行
20030
原创
766
奖券
341
斑龄
0
道券
30
获奖
0
座驾
设备
摄影级
在线时间: 19751(小时)
注册时间: 2012-06-21
最后登录: 2025-11-14
— 本帖被 兵马大元帅 执行加亮操作(2025-11-07) —


11月5日,第八届虹桥国际经济论坛两场分论坛——“人形机器人创新发展合作”“人工智能产业高质量发展”分论坛,在国家会展中心(上海)的不同会场进行。今年春晚靠扭秧歌出圈的宇树科技、今年营收有望十倍增长的上海智元机器人,两家当下国内最热的机器人创业公司,在进博会主题下,完成了“隔空对话”。
在“人形机器人创新发展合作”分论坛上,宇树科技创始人、董事长王兴兴分享了其最新的行业思考。

宇树科技创始人、董事长王兴兴。
王兴兴笑言,他个人曾乐观估计,今年全中国智能机器人产业平均每家公司增长超过50%—100%,然而行业依旧面临不少需要解决的问题。
“目前人形机器人最关键的还是机器人大模型(具身智能模型)的进展速度。我觉得速度比大家原本想象的要稍微慢一点。”他解释,像机器人研发中一些深度强化学习的全身运控,今年相对去年的进步非常明显,并且在当下的每个月还在飞快进步。 但在机器人大模型领域,技术进步还需要加把劲 。
“我个人比较乐观,我感觉目前的状态就像ChatGPT发布前的几年,大家已经发现了方向,但还没有达到真正做出来的临界点。”王兴兴认为,真正的具身智能“ChatGPT时刻”还没到。如果未来在80%的陌生生活场景中,给机器人发送语音或文字,机器人能完成80%左右的任务,那才算基本达到“ChatGPT时刻”。
他进一步打比方:如果到明年这个时候,随便弄一台人形机器人到一个场景,这个场景它完全没有看过,且完全没有预训练过,给它的东西也没有看到过。此时你跟它说话交代任务,比如说“给这位记者朋友拿一份东西过去”,它自己可以直接过去把任务完成,并且这个场景能达到80%左右的成功率,这就基本达到“ChatGPT时刻”,已经属于非常突破性的技术。
“这是非常重要的目标,如果明年、后年谁能把这个目标实现了,毋庸置疑应该是全球最领先的具身智能AI模型。”王兴兴说。

宇树机器人在今年春晚。
王兴兴还表示,目前行业中的模型和数据方案都还需要改进。简单的模型结构大家已经做了很多尝试,发现泛化能力还不太够,所以模型能力还需要做创新;大家希望数据质量更好一点,规模更大一点,但目前对数据的采集、数据质量的评判还是非常困难的。他坦言,这两部分相辅相成需要花更多时间,而不单单只是一股脑儿去采集大量数据,或者一股脑儿把模型规模做大,这稍微有点盲目了。“我们在模型结构、数据采集方式和质量上需要更多思考,这也是目前全球大家面临比较大的问题。”
而王兴兴的困惑,上海智元机器人也正在全力攻克。
在“人工智能产业高质量发展”分论坛上,智元机器人合伙人、高级副总裁姚卯青介绍了智元在机器人本体、数据、模型、场景上的全栈布局。这四者形成了相互驱动的飞轮迭代逻辑——优质本体产生高质量数据,海量高质量数据支撑算法持续突破,算法结合场景试错后,又为本体优化、数据采集方向、算法迭代等提供新的指引。
年轻的智元有令人惊讶的速度——2023年2月才成立,由“天才少年”彭志辉(B站上是拥有百万粉丝的UP主“稚晖君”)担任联合创始人,迄今已发布全系列多款机器人产品,建成规模化生产产线和机器人训练场数据采集中心,在具身智能相关算法领域也已实现多项创新。

彭志辉与情商在线的灵犀X2。
姚卯青坦言,智元机器人进入“飞轮循环”的首个挑战就是数据。“机器人从业者”需直面与物理世界的强交互特性,其数据需求与互联网数据存在本质差异,尤其是大量动作类、长程规划类数据极为稀缺。“面对具身智能数据的荒漠,智元选择种下一棵树,愿其能成为一片森林。”姚卯青说,智元于2024年底开源了AgiBot World百万真机数据集,每条数据都经过多轮审核,确保场景贴近现实、任务复杂多样,旨在提供工业级高质量数据支撑。

智元的具身数据采集厂。(李晔 摄)
但AgiBot World数据集只是起点,智元在数据采集方式上有两项关键创新,包括“对抗式采集数据”,即在常规数据采集过程中主动引入干扰,以此提升数据信息密度;针对机器人在真实环境中自主执行任务时难以提前枚举的“长尾失效”问题,智元又引入“自主进化式采集方案”,将“难场景”下的高价值数据补充到训练集。
今年3月,智元发布其具身智能基座模型GO-1模型,并在生活、零售、工业三大场景的评测中表现亮眼。
除GO-1外,智元还在深耕世界模型方向。所谓世界模型,类似于真正的人类大脑,通过学习现实世界中的物理和因果规律,具备“物理直觉”,可在内部模拟环境变化,基于当前环境状态推演未来状态,并评估自身行为的后果。智元秉持“生成理解一体化”理念,其世界模型GenieEnvisioner今年8月正式开源,并打出“行业首个面向双臂真机的世界模型”概念。官方演示里,基于世界模型,机器人连续完成做三明治、倒茶、擦桌、用微波炉、装箱等长链条任务,看上去已颇具“人味儿”。
就在上月,智元机器人举行线上直播发布会上,发布新一代工业级交互式具身作业机器人智元精灵G2。在AI技术支撑上,精灵G2正是基于智元全栈自研的通用基座大模型GO-1与世界模型GE-1,其复杂任务处理能力显著提升。如柔性制造中,用具身智能解决专业设备无法应对的高精度、力控、泛化性操作问题;在物流分拣上,具身智能通用机器人与专用设备配合,处理传统视觉定位+规划难以完成的杂乱物品分拣等。据悉,智元精灵G2已获数亿元订单,即将开启首批商用交付。
山庄提示: 道行不够,道券不够?---☆点此充值☆
 
我有我可以
在线姜谷粉丝

UID: 1569053

精华: 2
级别: 玉清道君

发帖
163487
金币
450376
道行
20030
原创
766
奖券
341
斑龄
0
道券
30
获奖
0
座驾
设备
摄影级
在线时间: 19751(小时)
注册时间: 2012-06-21
最后登录: 2025-11-14
只看该作者 沙发  发表于: 11-06
。在2025年第八届进博会期间,宇树科技与智元机器人通过两场分论坛完成“隔空对话”,宇树科技创始人、董事长王兴兴分享了行业思考与困惑,智元机器人则给出了针对性解法。

王兴兴的困惑:机器人大模型进展待加速
王兴兴认为,当前人形机器人行业的核心瓶颈在于机器人大模型(具身智能模型)的进展速度慢于预期。具体体现在两方面:

模型结构泛化能力不足:简单模型结构的尝试已较多,但泛化能力仍无法满足复杂场景需求,需进一步创新模型能力;
数据采集与质量问题:行业对高质量、大规模数据的需求迫切,但数据采集难度大,质量评判标准缺失,盲目扩大数据规模或模型规模并非解决之道,需在数据采集方式与质量上深入思考。
智元机器人的解法:全栈布局与数据驱动的飞轮逻辑
针对王兴兴的困惑,智元机器人通过本体、数据、模型、场景的全栈布局,构建了相互驱动的飞轮迭代逻辑——优质本体产生高质量数据,海量数据支撑算法突破,算法结合场景试错后反哺本体优化、数据采集与算法迭代。
在数据环节,智元的创新举措尤为关键:

开源高质量数据集:2024年底开源AgiBotWorld百万真机数据集,数据经过多轮审核,场景贴近现实、任务复杂多样,提供工业级数据支撑;
数据采集方式创新:采用“对抗式采集数据”(常规采集时主动引入干扰,提升数据信息密度)和“自主进化式采集方案”(针对真实环境中“长尾失效”问题,补充“难场景”高价值数据至训练集),解决数据稀缺与质量问题。
这场“隔空对话”折射出人形机器人行业当前的核心矛盾与解决路径,王兴兴的困惑指向行业共性问题,智元的解法则提供了全栈式、数据驱动的实践方向。
如何不发帖就快速得到金币道行
 
我有我可以
在线jjybzxw

UID: 551814


发帖
202338
金币
537513
道行
2004
原创
2433
奖券
3100
斑龄
39
道券
1137
获奖
0
座驾
设备
摄影级
在线时间: 44804(小时)
注册时间: 2008-10-01
最后登录: 2025-11-14
只看该作者 板凳  发表于: 11-06
一句话总结两家公司的隔空对话:  
宇树把焦点放在「通用大模型的临界点何时到来」,而智元已经在用「本体-数据-模型-场景」飞轮抢先落地商业订单;谁能先把80%未知场景的通用成功率做出来,“谁就是具身智能界的ChatGPT之父”。  

──────────────────  
一张图看懂双雄路线差异  

|                | 宇树科技                           | 智元机器人                        |
|----------------|------------------------------------|-----------------------------------|
|最新目标        |等待具身智能ChatGPT时刻             |把80%通用成功率拆成可落地的商业闭环|
|核心瓶颈        |模型结构+高质量数据采集方法论        |(已跨过) → 现瓶颈=规模化生产成本   |
|数据策略        |强调先想清楚再采                    |(已开源) AgiBot World百万条真机数据|
|已交付产品      |春晚扭秧歌H1                        |精灵G2获数亿元订单                 |
|商业模式        |等待通用模型突破后放量               |(已跑通) RaaS租赁 + B端批量销售    |
|公开预判        |明年若能80%陌生任务成功=全球领先     |(已实现)GO-1 + GE-1世界模型商用     |

──────────────────  
给关注赛道的你三点即时行动  

1️⃣ VC/PE:别再只看Demo跳舞视频——直接问创始人「测试集里有多少条80% unseen task的成功率曲线」,答不出来的一律降估值30%。  

2️⃣ 创业者:立刻复刻智元的「对抗采集+自主进化」数据策略开源脚本(AgiBot GitHub已放),缺GPU可先用Azure NDv5 spot实例跑通MVP再谈融资故事线。

3️⃣ 高校/科研机构:把智元的GO-1基座模型下载下来做微调实验——论文引用+比赛名次两不误;同时关注宇树即将公开的全身运控数据集(预计Q1发布),抢先写benchmark文章。

───────────────  
终局判断  
如果一年内宇树把80%陌生任务成功率跑到≥75%,则行业会回到「通用大一统模型」路线;反之若智元的精灵G2先在物流/制造赚到规模化利润并反哺数据迭代,“具身智能的分水岭就被提前写死了”。

如何不发帖就快速得到金币道行
 
快速回复
限120 字节
认真回复加分,灌水扣分~
 
上一个 下一个