您当前的位置 : 首页 实时讯息

5年后,人形机器人就能去你家“打工”?

3月10日

去年已实现量产近千台的

中国机器人初创公司智元机器人发布

通用具身基座模型智元启元大模型

(Genie Operator-1,简称GO-1)

因其首创的ViLLA架构

降低了具身智能研发门槛

并能够让机器人持续进化

让不少网友评论称:

“这破解了具身智能的‘进化密码’”

机器人“烤面包”。

图源:智元机器人官网

网上的视频

也能用于训练机器人了

据了解,GO-1创新性采用了


Vision-Language-Latent-Action (ViLLA) 架构

由VLM(多模态大模型)

和MoE(混合专家)组成

可谓让人形机器人拥有了智慧大脑

智元机器人相关负责人介绍

GO-1大模型的特点包括4个方面

机器人“煮咖啡”。

图源:观察者网

一是可以利用人类视频学习各种技能

增强模型对人类行为的理解

例如,它可以根据之前训练时

看过的“挂衣服”视频

设想这个过程包括哪些步骤

然后执行一连串步骤完成任务

二是能在极少数据甚至零样本下

使机器人快速适应新场景、新任务

完成小样本快速泛化

例如让人形机器人“倒水”

搭载大模型后

完成该动作需采集的数据量

较未搭载大模型减少1/10至1/50

三是能够在不同机器人形态之间迁移

快速适配到不同本体

此外,该大模型还可以

从实际执行遇到的问题数据中

持续进化学习

“越用越聪明”

机器人站上服务台。

图源:观察者网

业界相关人士表示

GO-1大模型将加速具身智能普及

机器人将从依赖特定任务的工具

向着具备通用智能的自主体发展

将具身智能推上了一个新台阶

人形机器人“打工”

还要多久才能实现

让机器人擦桌子、拉小提琴

如今早已不是新鲜事

但这类机器人只能完成预设程序

而非具备自主完成任务的能力

或者说并不真正具备“智能”

随着具身智能的不断演化

机器人正在逐渐完成

“从单一任务到多种任务”

“从封闭环境到开放世界”

“从预设程序到指令泛化”

三层进化

也就是说

随着人工智能技术的不断进步

和软硬件的持续优化

人形机器人的商业化进程正在加速

灵巧机械手与观众互动。

图源:新华社

在美银近日发布的研报中,分析师预测

人形机器人即将告别概念验证阶段

在十年内迎来多行业应用爆发期

预计到2030年

全球人形机器人年销量将达到100万台

到2060年

人形机器人总保有量将达30亿台

届时人均将拥有0.3台机器人

日前国泰君安在研报中也进一步提到

特斯拉的Optimus

计划在2025年步入量产

2026年大规模生产

中国多家人形机器人厂商

也计划开启外售

人形机器人将迎来“量产元年”

智元机器人相关负责人表示

目前,机器人能够

在不同场景中执行多种任务

而不需要针对每个新任务重新训练

也不再局限于预设程序

能够理解自然语言指令

并具备一定推理能力

一旦机器人“能听懂人话”

就可以在商业、工业、家庭等多领域

发挥更大的作用

在北京市机器人产业园(亦庄),国家地方共建具身智能机器人创新中心研发的人形机器人“天工”在进行奔跑展示。

图源:新华社

家庭服务有望成为

具身智能机器人落地应用的重要场景

智元机器人相关负责人说

真正让人形机器人走进家庭“打工”

预计还需5年左右

在位于深圳市南山区智园的优必选总部,工作人员对人形机器人进行测试

图源:新华社

同时,有业界人士还提到

脑机接口技术可以实现

将智能算法与机器人的

感知、行动和环境交互能力相结合

在医疗康养、工业安全

教育体育、智慧生活等领域

展现广阔发展前景和巨大市场潜力

此外,应对人口老龄化、科学研究

以及太空探索等人类社会发展问题

也需要具身智能技术的辅助

撰文:孔繁鑫编辑:雷渺鑫排版:李汶键统筹:李政葳

参考:新华网、人民网、中国新闻网、证券时报网、澎湃新闻、观察者网、华尔街见闻

来源: 世界互联网大会