智平方合伙人张鹏。新京报记者 王子诚 摄
新京报贝壳财经讯(记者罗亦丹)5月13日,由新京报贝壳财经、北京经济技术开发区管委会主办的“人形机器人”高端闭门研讨会在北京亦庄·机器人大世界举行。智平方合伙人张鹏在会上表示,最近举行的机器人马拉松比赛对整个行业提出了挑战,在现实的挑战中检验机器人的硬件、软件、系统、算法是非常有必要且有好处的,“我们看到天工非常完美地跑完了半马,这对整个产业链来说都是很振奋的消息。”
张鹏认为,当前真正需要去做的事情是让机器人不断地适应各种环境,让它知道在不同的场景和任务里怎样持续地学习和工作。
“目前大家谈到VLA(视觉—语言—动作模型),说得通俗一点,就是机器人通过各种传感器能够与物理世界交互,它可以通过VLA模型,知道我在哪儿、周围有什么、我需要做什么,再通过模型转化成机器人的规划和动作。这是现在整个学术界、产业界通过VLA要解决的问题。”张鹏说,“VLA的应用还面临几个挑战,一是空间智能,二是全域全身控制,三是软硬件的垂直整合。”
张鹏表示,智平方从成立开始,就致力于用大模型端到端的范式来打造机器人系统,率先突破了端到端VLA模型的核心难题——空间智能,并在行业中首次通过VLA实现机器人的全域感知与全身控制,使机器人既能理解常识,也能完成更多样的具体任务。在具身机器人上,这种大规模的互联网数据、仿真数据,以及在真实应用场景里采集回来的数据都很重要,所有数据汇聚在一起,才能完成在VLA在具身机器人上面的应用。而具身大模型驱动机器人进入通用智能。
“我们不指望机器人在今年和明年就进入用户家中,但是我们可以从半结构化的场景开始,逐渐过渡到非结构化场景,这就是智平方在推动商业化过程中的路径,先从工业服务、公共服务开始,再逐步过渡到家庭和康养,不断深入应用。”张鹏说。
校对 柳宝庆 穆祥桐