自杭州宇树科技股份有限公司(以下简称“宇树科技”)的机器人在春晚舞台“出圈”以后,宇树科技的机器人和宇树科技创始人王兴兴就成为了人形机器人行业的“顶流”,但在过去半年的时间里,王兴兴和自家的机器人公开亮相的场合并不多见。
在第七届智源大会的现场,王兴兴和宇树科技机器人G1(宇树科技的一款人形机器人产品)同时亮相,在聚光灯下,G1一套格斗拳引爆了现场气氛,台下的观众纷纷拿出手机拍照记录,王兴兴也首次回应了关于机器人跳舞、打格斗等存在争议的话题。
在开幕式智源具身智能会客厅环节,北京人形机器人创新中心总经理熊友军、北京大学助理教授、智源具身智能研究中⼼主任、银河通用创始⼈兼CTO(首席技术官)、穹彻智能联合创始⼈卢策吾、 Physical Intelligence联合创始⼈兼CEO(首席执行官)Karol Hausman共同参与了讨论。
终极目标是让机器人“干活”
在人形机器人真正走入千家万户之前,市场习惯给予这些新生事物过高的期待。宇树机器人在赢得掌声和关注的时间里,同样也面临着质疑与争议。“只会跳跳舞的机器人有什么意义,能带来什么价值?”这样的质疑声一直存在。
王兴兴在此次具身智能会客厅中也公开回应了上述争议。“无论是春晚上的表演还是格斗比赛,我们是希望展示给公众目前机器人行业的发展现状,从而带动整个机器人行业的发展,未来我们也希望做更多的商业化拓展和尝试。”
在6月7日的具身智能与人形机器人专题论坛上,众擎机器人创始人、董事长赵同阳也回应了上述争议。“任何一种新的设备出现时,都会带来一定的情绪价值,前段时间我们被定义成为‘影视公司’,只会做表演,我并不觉得这种定义是不好的,相反我是拥抱这个事情的,如果能把表演这个行业做大也是一个很好的经历。”赵同阳表示。
事实上,不仅仅是机器人跳舞受到质疑,也同样存在声音质疑机器人跑马拉松的意义。对此熊友军的观点是,通过比赛的形式可以让大众对现在机器人的发展状况以及技术水平有更好地了解。赛场本就是一个很好的技术训练场,因为很多比赛的场景都是来自人类真实的生活场景,而实验室的场景很多都是自己构建的场景。
“我们毕竟希望机器人真正走入我们生活、服务人类,所以这是很好的训练场,对提升机器人的技术有很大的帮助。”熊友军指出。
多位长期关注人形机器人赛道的投资人告诉新京报贝壳财经记者,今年在选择投资标的时,他们会更加注重场景应用与落地能力。而这也是目前人形机器人行业创业者们正在追求突破的事情,在北京经开区落地人形机器人总部的优必选正在加速商业化进程,20台优必选工业人形机器人Walker S1将于今年上半年在东风柳汽的汽车制造工厂完成部署,应用于汽车整车制造;乐聚机器人已经与多家车厂达成了合作。
王兴兴指出,“我们的终极目标是希望在AI技术的发展下帮助人类去从事一些辛苦的工作,在终极目标没有实现之前,通过参加一些表演展示机器人的真实发展进度,同时产生一部分的商用价值。”
银河通用计划今年开出100家机器人药店
“今天我们再谈具身智能时,一个很重要的目标就是要推动其产业化落地,如果我们的人形机器人可以24小时服务,这样就构成了具身智能真正走向产业化,创造新的生产力。”王鹤指出。
与宇树科技不同,银河通用机器人专注研究具身智能大脑。在去年的世界机器人大会现场,银河通用的机器人在现场展示从货架上抓取饮料;在今年的中关村论坛现场,银河通用机器人将两台机器人Galbot设置到了主论坛一层小关店铺,与北京好饮科技的机械臂打配合,两个机器人合作就可以完成一杯咖啡,实现了无人化操作。
在目前学术界的研究中,VLA(视觉-语言-动作模型,Vision-Language-Action)热度高涨,在王鹤看来,VLA能够真正充分地吸收数据背后的知识,让这些知识发挥出最大的性能,而不会受制于一些模块化方案中间阶段的一些错误。
6月1日,银河通用正式推出自主研发的产品级端到端导航大模型TrackVLA。这是一款具备纯视觉环境感知、语言指令驱动、可自主推理、具备零样本(Zero-Shot)泛化能力的具身大模型。“VLA虽然是具身智能领域的热点,但VLA到底应该做什么任务业界并没有统一认知。我认为目前 VLA最适合做的就是移动、抓取和放置,这几项技能主要依靠视觉,末端再加上触觉或力觉传感器,就可以很好地在目前的一些场景中应用。”王鹤表示。
据介绍,银河通用机器人已经在北京开了7家无人药店,今年将在北京、上海、深圳一共开100家药店。在6月7日的具身智能分论坛上,王鹤算了一笔账,24小时营业的店员工是要3班倒,这些人力成本是远高于机器人运用三年的成本的。“三年三个工人需要的工资大概在70万左右,只要机器人的价格低于70万就可以低于雇佣店员需要花费的费用。”王鹤指出。
在卢策吾看来,具身智能需要逐步落地,但同时也需要星辰大海。想要具身智能逐步落地,就需要通用,如果做通用,VLA需要压缩不确定性。“如果把VLA比作火锅底料的话,现在还是一个清水锅,只能服务一部分人,要服务更多人就需要不停往里面加东西,本质是增加更多额外信息,使VLA更加强大,穹彻智能一直在探索力反馈模式的研发。”卢策吾说。
透过智源大会的主论坛,可以看到目前具身智能的发展并未到技术收敛的阶段,但各家企业正在变得更加务实,落地能力也正在逐步提升,人形机器人所带来的想象空间正在走进现实。
新京报贝壳财经记者 张晗
编辑 岳彩周
校对 柳宝庆