具身智能离“GPT时刻”的时间预判与行业观点
1. 智元内部的阶段性目标
短期(2年内):智元合伙人姚卯青在2025年表示,随着真实物理数据的快速积累(预计2年内达到大语言模型的数据规模),具身智能有望迎来类似ChatGPT的“涌现时刻”,实现从单一场景模仿到具备思维链和长程规划的自主适应能力
。
中长期(2030年):智元董事长邓泰华在2026年合作伙伴大会上提出,2030年后机器人将在制造、物流等场景涌现群体智能,生产力水平逼近人类水平,出货量保持快速增长
。
2. 行业发展的核心挑战与突破点
数据瓶颈:当前全球具身智能的高质量真实数据仅约50万小时,远低于大语言模型的100万亿词元规模。智元通过自研硬件、数据治理平台和规模化产能网络,计划2026年实现1000万小时年数据产能,推动数据飞轮效应
。
技术路径:目前机器人多局限于单一场景的模仿学习,尚未形成通用性能力。智元提出“部署态”概念,以万台级量产和标准化解决方案为基础,实现机器人在工业产线等场景的7×24小时稳定作业,从“实验室思维”转向“产业思维”
。
3. 行业共识与争议
乐观预期:部分从业者认为,具身智能的“GPT时刻”可能在2-5年内到来,前提是解决数据质量、模型泛化和规模化交付等核心问题
。
谨慎观点:也有观点指出,物理世界的复杂性远高于数字世界,具身智能的“ChatGPT时刻”可能需要5-10年,需突破空间智能、三维理解等底层技术