切换到宽版
  • 718阅读
  • 1回复

[智能应用]公司研发面向个人家用的机器人,未来要逐渐走向具身智能 [复制链接]

上一主题 下一主题
在线huozm32831

UID: 329002

精华: 1097
职务: 超级斑竹
级别: 玉清道君
 

发帖
106542
金币
9902
道行
19523
原创
29307
奖券
17354
斑龄
191
道券
10126
获奖
0
座驾
 设备
EOS—7D
 摄影级
专家级认证
在线时间: 20258(小时)
注册时间: 2007-11-29
最后登录: 2024-12-25
— 本帖被 兵马大元帅 执行加亮操作(2024-02-23) —
达斯·A·阿伯内特所著《机器人简史》给予我们两个看待机器人的视角,第一个是人类逐渐机器化。这正是当下中青年群体的生存状态的写照,即来自环境和他者的物化越发巩固。另外一个是机器的人化,即各种商用机器人以替代某一个工种为使命。上周斯坦福家务机器人的现象级刷屏,其实就代表着逐渐物化的我们看到逐渐人化的机器时,对物种优势的喜悦和个体困境的消解。

机器人诞生之初是来源自奴隶制,是受控制的象征。如今,大模型和机器人的结合在不断拓宽机器人的自由度和我们对于未来世界的想象。拥有类人智能的通用机器人,也开始在现实中有了实现的曙光。

2021年马斯克在特斯拉AI日上公布人形机器人项目揭开了“机器人时代”的大幕。2022年11月,OpenAI发布基于chatgpt3.5的ChatGPT,更进一步带来从大模型到通用智能的可能。2022年4月,在TED创始人Chris Anderson的访谈中,马斯克表示他将生产猫女机器人。具身智能将成为未来时代中最颠覆性的技术浪潮。



图1 埃隆马斯克在TED承诺制造猫女机器人

作为人类生育提倡者,马斯克提出猫女机器人的本质是希望解决退休人口的康养问题。根据梁建章的《人口战略》,受制于生育率下降,当1992年出生的2119万人需要养老的时候,国家刚好需要1000万台机器人补充承担康养的成本。早在2020年10月29日,马斯克对特斯拉是否做猫女机器人做了一个双选项也是单选题的调研,收到928281份投票,81.9%表示肯定想要。



图2 928281份投票中81.9%表示肯定想要catgirl robots

▍机械姬的诞生

我们到底能否制造出“猫女”机器人?

在具身智能的背景之下,家用机器人公司”机器姬”(JI Robotics)应运而生。

但当你蒙上眼睛,想象猫女机器人的电影形象的时候,扯开眼罩后,却发现”机器姬”(JI Robotics)的家用机器人的形象竟然如此辣眼,像如花一样美颜。

但这或许是当下最快也最低成本实现家用服务机器人的路径。

机器姬公司的产品“机器姬·毕玲”(唤醒词:毕阿姨)形态如图3,主体包含差速底盘,深度摄像头,机械臂和终端执行器四部分组成。分为独臂版本(又称杨过版)、双臂版本,机械夹爪版本和灵巧手版本。



图3机器姬毕玲的四种产品形态,分别是单臂、双臂、夹爪和灵巧手

据了解,机器姬是在已经批量落地的行业知名产品真机小黄马基础上升级而来,底盘系统、视觉系统、电路系统、定位系统、规划控制系统延续承接了真机小黄马7年的研发和技术积累,直接继承了真机小黄马的定位、导航和规控能力。由于基于成熟产品升级而成,全自研造就了机器姬更低的生产制造成本和落地可能。

在过去,真机小黄马单品已经有着超5000万的研发投入和海外客户的批量验证,为机器姬的快速落地和低成本化打下了坚实基础。复用核心技术、供应链和生产制造体系,因此机器姬公司的“机器姬·毕玲”样机推出速度令人乍舌。

目前,基于传承的核心技术和团队的工程化能力,机器姬公司已经具备大规模量产的产品化潜力。



图4 机器姬毕玲的前身产品在海外稳定运营已超四年,研发投入超5000万

▍人形的雏形与野望

因为人类的社会环境就是为人类而定制,因此其实具身智能最好的形态是人形机器人,机器姬公司也有着制造人形机器人的梦想。

受限于落地难度,机器姬初期仅研发一款人形机器人静态语音交互版,虽然不具备行动能力,但亮点在于端侧成功部署大语言模型,沟通异常流畅。

据了解,这款产品主要基于满足情感交互需求而研制。机器姬公司希望,通过更多用户对于静态语音交互版的训练,未来能为机器姬的长期研发提供更准确的用户反馈。因此这款产品的售价也在万元以内。

值得一提的是,该机器人端侧的部署具备实时性和低延迟 的优势,特别适合在弱网和无网的环境,可以为客户提供更流畅和更稳定的体验。更重要的是,端侧的数据会在本地进行处理,可以更好的保护客户的隐私和信息安全。这也避免了下半句延迟 30 秒的尴尬局面。

这款静态语音版的产品,被命名为“机器姬·顾言”(唤醒词:顾言同学)。其产品卖家秀如图所示,机器姬目前开放对该款产品的反馈和预售定制。



图5 机器姬顾颜的产品标准图, 部署了端侧的大语言模型

据悉,根据机器姬公司的人形路线图,2025年开始才会启动具备操作能力的家用双足人形机器人的研发,预期2028年有可能可以完成。2025年以端侧接入大模型的静态语音交互的版本为主,基于技术复用的原则,旨在机器姬·毕玲同时具备端侧的交互能力。

▍核心技术解读:自研HomeRT

机器姬公司设定的产品场景如下,个人向“机器姬·毕玲”发出语音或文字指令,“请帮我清洁一下卧室”或“帮我整理一下餐桌”,机器人可以完成上述任务。

这些由人类发出的任务,需要机器人对环境和世界有较高的理解。类似谷歌的AutoRT, SARA-RT, RT-Trajectory,机器姬公司自研的HomeRT 是基于传统的robotics transformers和家用场景数据库,建立了人类指令和机器人行动之间的桥梁。HomeRT可以帮助机器人形成有效决策,感知和理解环境,并在环境中进行导航。

HomeRT延承了谷歌机器人的研发路线,融合了视觉语言模型(VLM)和机器人控制模型(RT-2),可以将机器人部署到新环境去获得训练数据。Home RT可以同时指导多机器人同时执行不同的任务,给出机器人可执行的工作计划列表。在用于训练的视频数据中加入机器人的视觉轨迹。这些视觉线索的引入对于性能的提升起到关键作用。

除此之外,真机小黄马所具备的传统机器人的感知、规划、控制、定位和一系列高阶技术,无缝延续在机器姬产品中,部分任务按照规则体系执行,提升总体任务成功率。

HomeRT具备不错的技术特性,具体来看包括两个方面:

(1)大语言模型决策规则和传统机器人的安全措施并举

机器姬公司认为 ,家用机器人需要证明在真实世界的稳定的绝对安全,才能集成到我们日常生活。Home RT拥有一个安全防护栏的决策规则,嵌入在大语言模型(LLM)的仲裁器中。除了机器人的三大定律之外,安全规则还包括机器人禁止机器人袭击人类、宠物,禁止使用尖锐物体和电器和火源。除此之外,还有大量的传统机器人的安全措施,包括超声波、急停开关、防撞条等,导航时候防止物理碰撞和关节力超过阈值等。

(2)真实家用具身数据集形成的数据飞轮

机器姬公司认为,数据是护城河,是企业真正的壁垒。鉴于用户的隐私数据无法收集,因此机器姬公司计划自行搭建2000平米大小的一个同时运行20台机器人的类家庭的数据收集环境Repeat Collection and Deployment Environment(RCDE),前期使用遥操作示范,后期使用机器人组内竞争和人类裁判,从机器人的最成功任务活动中沉淀数据集。

在数据集的基础上,随后将收集到的数据用于模型训练,并将新模型进行部署工作,循环往复形成数据飞轮。同时周期性的调整类家庭环境的环境内容,形成更强的泛化能力。机器姬家用具身机器人训练和推理的数据均依靠自研硬件本体的采集,特别是多传感器和多维度数据的采集,更有利于部署阶段的运行成功率。机器姬的核心思路是,在真实的环境中,进行规模化的真实数据的采集,数据飞轮反哺具身智能机器人的算法,并再应用于真实环境中,循环往复。

▍禀赋超群的创始人

机器姬是人工智能和机器人领域的知名技术专家刘智勇所创立的第二家机器人公司。创始人刘智勇,不仅是机器人领域的青年技术领导者之一,还是全球少见的同时拥有机器学习和移动机器人技术双重深厚背景的创业者。

拥有机器人本体的研发和落地的成功经验,其研发的真机小黄马在海外批量落地和部署。同时,他还有在爱因斯坦的母校苏黎世联邦理工学院的机器学习和深度学习的科班学习经历和研究经验,其授课老师是的蜚声世界的机器学习方向的教授。

刘智勇是埃隆马斯克的迷弟,从苏黎世联邦理工学院全奖博士休学创业的核心动机也是其希望创立一家类人机器人公司。在条件不成熟的时候,他曾进入阿里巴巴从事的就是机器学习算法的研究工作。

在近7年时间担任移动机器人公司的首席技术官期间,他在机器人感知、定位、规控技术上进行了持续深耕,工作内容涵盖了图优化算法、传统机器学习算法和视觉语言模型,目前是ZROS核心作者以及20余项专利的第一作者,拥有移动机器人的SLAM、规控、任务调度,电路系统、整机生产等软硬件一体化的工程化能力。可以说是行业里少见的在机器学习和移动机器人本体技术两方面均有深厚背景的知名技术专家。



图6 人工智能和机器人技术知名技术专家刘智勇在国际会议上作主旨演讲

▍未来路线的选择

做选择是成为创业者最大的难题。刘智勇同样面临着公司产品和技术栈的路线选择问题。

目前,机器人领域拥有三个广泛可落地的市场,分别是蓝领劳动力,家庭和太空探索三部分。在家用市场,在全球范围内2.3billion的家庭,700million的老年人群需要在家的照顾。工业领域,则主要在汽车制造和3C制造领域潜力巨大。

为此,创始人刘智勇决定在这些路径选择三选二,希望利用共同的大模型训练设施和机器人本体,同时切入最主流的应用场景。为此他们选择使用相同的产品形态和大模型架构,同时在家用场景和工业场景各创建一个公司,分别是“机器姬”(JI Robotics)和“机能机器人”(NENG Robotics),并独立进行融资。

“机能机器人”从汽车制造业的组装工序作为切入,逐渐拓展到质量检查、焊接工序、喷漆工艺、物料搬运、协作作业等任务,主打long-horizon的任务和中等复杂度的工作,机器人大讲堂后续会做专题报道。

而机器姬和机能机器人的产品则接近于同款,均是轮式+机械臂+灵巧手/夹爪的产品形态。由于TO C的决策灵活性高和产品容忍度更高,TO B的标准化程度更高。

刘智勇认为,参考清洁机器人B端对于人效比有着高标准要求,因此家用的落地和普及的时间点反而远早于商用。为此,刘智勇决定同时设立两家公司,以应对具身智能领域TO C和TO B爆发时间点的不确定性,并希望从先爆发的公司获得个人收益反哺后爆发的公司,实现鸿沟跨越。



图7 Figure Master Plan提出三个主流市场,蓝领劳动力、家庭和太空探索

在刘智勇的计划中,会基于PMF分阶段切入客户需求,实现数据的飞轮效应,并逐渐压缩硬件成本。为此“机器姬”(JI Robotics)的家用机器人机器姬·毕玲(昵称毕阿姨)会从高端市场和高净值人群切入,首先作为奢侈品和豪奢象征进入少部分家庭,解决一部分立体清洁和整理物品的需求。随着规模化和成本的降低逐渐进入大众家庭,在用户的不断反馈中不断提升机器人自主决策和自主行为的能力,在这个过程中形成数据飞轮效应。

在大历史角度去看,机器姬公司团队正积极利用自身核心技术优势,逐步践行产品化的路径,有望快速提高人和机器人的自由度,并保证物种优势和个体安全,成为具身领域推动世界进步的公司。
山庄提示: 道行不够,道券不够?---☆点此充值☆
 
  




    
在线jjybzxw

UID: 551814


发帖
112133
金币
1178612
道行
1965
原创
2211
奖券
2223
斑龄
29
道券
599
获奖
0
座驾
设备
摄影级
在线时间: 27090(小时)
注册时间: 2008-10-01
最后登录: 2024-12-26
只看该作者 沙发  发表于: 01-11
具身智能(Embodied Intelligence)是一种智能形态,它强调智能系统与物理环境的紧密互动和相互适应。具身智能的核心思想是,智能不是孤立地存在于计算系统中,而是与实体环境、感知、行动和学习过程密切相关。在具身智能的框架下,智能系统需要通过与环境的交互来获取知识、技能和经验,进而提高其智能水平。

对于公司研发面向个人家用的机器人来说,逐渐走向具身智能具有以下意义:

1. 提高机器人的自主性:具身智能强调机器人与环境的互动,这有助于提高机器人的自主性,使其在执行任务时更加独立,减少对人类的依赖。

2. 增强机器人的适应能力:具身智能使得机器人能够更好地适应环境变化,例如在不同的家庭环境中执行任务时,能够根据环境特点调整自己的行为。

3. 提高机器人的学习能力:具身智能强调机器人的学习过程,使得机器人能够通过与环境的交互来不断学习和改进自己的行为,提高其智能水平。

4. 促进人机交互的发展:具身智能使得机器人更加注重与人的交互,例如通过观察和模仿人类的行为来学习技能,从而提高人机交互的自然性和有效性。

5. 提高机器人的安全性:具身智能强调机器人与环境的相互适应,这有助于提高机器人的安全性,使其在执行任务时能够更好地避免碰撞和伤害。

总之,公司研发面向个人家用的机器人逐渐走向具身智能,有助于提高机器人的性能和用户体验,推动家用机器人的普及和发展。
如何不发帖就快速得到金币道行
 
快速回复
限120 字节
认真回复加分,灌水扣分~
 
上一个 下一个