张田勘
蛇年春晚舞台上,穿着花棉袄转手绢的“显眼包”人形机器人迅速走红,后续的销售市场供不应求。该人形机器人研发企业负责人近日在接受媒体采访时透露,今年年底前,人形机器人会达到一个新量级,并将于明年应用于一些基础服务业和工业领域。
行走、跳舞、空翻、避障、跋山涉水……世界上人行机器人的研发成果日新月异。人们购买人形机器人当然不只是为了娱乐,而是要让它们工作。这是不是意味着人形机器人的时代即将来临?它离走入大众生活的目标还有多远?未来的智能升级又有哪些值得期待的变化呢?
2025年2月21日,上海举办全球开发者先锋大会,一名观众与宇树科技人形机器人握手。
机器人技术发展历经三代更迭
机器人(Robot)是一种能够半自主或全自主工作的智能机器,而人形机器人(Android)是一种旨在模仿人类外观和行为的机器人。无论是模拟人类行为或思想,还是模拟其他生物的机械(如机器狗、机器猫等),都是机器人。在现代工业领域,机器人专指能自动执行任务的人造机器设备,用以取代或协助人类工作,它们一般是机电设备,由计算机程序或电子电路控制。
早在2000多年前,世界上就有关于机器人的描述和制造。比如,公元前2世纪,古希腊人发明了一个可以借助蒸汽唱歌的机器人,其动力来自水、空气和蒸汽压力。中国东汉时期,科学家张衡发明了测量路程用的“计里鼓车”机器人,车上装有木人、鼓和钟,每走1里击鼓1次,每走10里击钟一次;三国时期,蜀汉丞相诸葛亮研制出的木牛流马是最早的陆地军用机器人。
20世纪50年代,美国发明家乔治·德沃尔与约瑟夫·恩格尔伯格一起发明了第一款工业机器人Unimate 001,这也是第一个由电脑控制的数字化机器人。到了现代,日本早稻田大学的加藤一郎团队在1973年研发出世界上第一台真人大小的人形智能机器人WABOT-1,它有两只手、两条腿,体内有肢体控制系统、视觉系统和对话系统,胸部装有两个摄像头,手部装有触觉传感器。
简单梳理机器人的技术发展,可以分为三代。
第一代是可编程机器人,可根据操作员所编的程序完成一些简单的重复性操作。这一代机器人从20世纪60年代后半期开始投入使用,目前广泛应用于工业界。
第二代是感知机器人,也称自适应机器人,是在第一代机器人的基础上发展起来的,具有不同程度的感知能力。这类机器人在工业界虽有应用,但还不广泛。
第三代机器人可称为智能机器人,具有识别、推理、规划和学习等能力,能够感知外界并做出行为选择,以及在非特定的环境下作业。如果不以人形为限制的话,现在的智能驾驶系统也可称为智能机器人,不过这类机器人还在试验阶段,仅少部分特定使用。
机器人为何要向“人形”发展
现在的机器人大部分都是非人形的,主要应用于工业,即通常所说的工业机器人。它们大多应用于制造业工厂里的生产线,还应用于射出成型业(制造业中的核心技术,广泛应用于塑胶和复合材料的生产)、建筑业,以及石油钻探、矿石开采、太空探索、水下探索、清理毒害物质、搜救、医学、军事等领域。
工业机器人的作用是帮助人们工作,相比之下,人们更喜欢人形机器人,也就是具有人形的智能机器人。它们既能帮人干活,还有娱乐功能,甚至还出现了能与人交谈的聊天机器人。
工业和信息化部发布的《人形机器人创新发展指导意见》指出,人形机器人集成人工智能、高端制造、新材料等先进技术,有望成为继计算机、智能手机、新能源汽车后的颠覆性产品。但是,研发人形机器人和使其成为人类可广泛使用的产品极具挑战性。
首先,人形机器人应当拥有具身智能(Embodied Artificial Intelligence,EAI),即将人工智能融入人形机器人,让它们具有像人一样感知、学习和与环境动态交互的能力,并伺机行动。想拥有具身智能,人形机器人需要拥有人工智能领域的诸多技术,如计算机视觉(模式识别、图像处理)、自然语言理解与交流(语音识别、合成、对话)、认知与推理(各种物理和社会常识)、机器人学(机械、控制、设计、运动规划、任务规划等)、博弈与伦理(人机、代理人的交互、对抗与合作,机器人与社会融合等)、机器学习(各种统计的建模、分析工具和计算方法)。
其次,人们希望人形机器人能干家务,并且与人互动,这是人类文化、心理认同以及生物自然演化规律所决定的。既然要求机器人为人工作,它的“人形”就是人类的共识,也是现在和未来机器人研发和应用的方向,人形机器人只有呈现与人尽可能接近的相貌、语言、肤色、身高、体重和心理、行为方式,才能为人类或特定人群所完全接受。人们喜欢机器人与自己有相似的相貌和行为,是人类在演化中形成的一种心理定势。人形机器人受青睐是缘于信任,而信任起源于最基本的心理认同和亲和力,只有信任和认同机器人,才有可能让其为人服务。
现在研发者对于机器人的“人形”只是初步要求,未来的人形机器人很有可能按照各个国家和民族的人(生物形状)的大数据和平均值为模板,研发出更有真实感的人形机器人,以便能更好地进行指挥和操控。
从科学的角度来看,人形机器人的研发本身就会考虑到生物和人类演化的规律。现代陆地生物和人类之所以演化为四条腿和两条腿走路,是因为陆地环境要求生物具有应对自然中各种地形的行动能力和特征,如能跨、跳、跑、走,能上坡下坎、攀援、游泳等。因此,人形机器人是对陆生动物和人类“仿生”的必然选择。可以想见,未来有一天,外貌、身材、肌肉、温度、表情等方面都像人的人形机器人,是社会接纳度最高的智能产品。
中国人形机器人跻身世界前列
当前,全球人形机器人研发企业主要分布在美国、中国、日本、英国等国。中国有宇树科技、智元机器人、优必选、傅利叶智能、小米、中国电科21所机器人工程中心等,竞争激烈。2023年12月19日,中国电科21所机器人工程中心公开展示了其研发的第一代人形机器人电科机器人1号。它身高1.62米,体重60千克,拥有39个自由度(包括手指关节),单臂最大负载5千克,双臂最大负载10千克,最快行走速度5千米/小时,可拿杯子、搬箱子,在斜坡、碎石地、草地等非平整路面上如履平地。
而在蛇年春晚舞台上火出圈的16个人形机器人H1,名为福兮,身高约1.8米,体重约47千克。这种机器人的移动速度为3.3米/秒,是目前世界上走得最快的人形机器人,潜在运动性能大于5米/秒,电池容量864Wh,可快速更换电池。
前面提到的人形机器人的核心特征具身智能,在福兮身上已经具备了一些。福兮依靠高精度3D激光SLAM 自主定位和导航、多智能体协同规划、先进组网方案等技术,不仅能够在舞台上确保精准定位和稳定连接,让动作和队形达到复制、粘贴的效果,强大的集群协同控制系统还让它能及时随舞台变化做出相应调整。同时,福兮配备了360度全景深度感知技术,就像长了许多双眼睛,能全面感知和看清周围环境,让它得心应手地完成转手绢这样的技术活儿。扭胯、甩手、摆臂、转手绢、扭秧歌……在AI驱动全身运动控制技术的控制下,福兮手上功夫灵巧,身体动作整齐。福兮还能完成原地空翻动作,它的最大关节扭矩能达到360牛顿·米(N·m),完成许多真人表演者都难以实现的高难度动作。
H1人形机器人是我国民用机器人公司宇树科技于2023年8月推出的产品,2024年5月,该公司又推出了G1人形机器人。G1身高约1.27米,体重约35千克,具有超于常人的灵活性,小跑速度大于2米/秒,拥有23-43个关节,最大关节扭矩达到120牛顿·米,可进行动态站起、坐下折叠、舞棍等高难度的动态动作。G1还可选配Dex3-1力控灵巧手,通过力位混合控制,模拟人手的精准操作能力,可以砸核桃、搬重物,也可以拿取鸡蛋等易碎物品、轻松开启汽水瓶盖,或完成焊接等精细作业。G1的感知和传感能力源自它搭载的Intel RealSense D435和LIVOX-MID360 3D激光雷达,能够进行360度的探测感知,可以更好地适应周围环境。
去年,在面向开发者的全球人工智能大会上,全球9家机器人公司研发的9台人形机器人亮相,中国人形机器人占了两台:一是宇树科技的H1,二是小鹏公司研发的PX5。前者是中国首款“能跑的全尺寸通用人形机器人”,后者能踢足球、越障行走、骑平衡车等。这表明,中国的人形机器人已进入国际一流水平行列。
预计最早2028年进入消费市场
展望国际,其他一些科技公司的人形机器人目前正处于领先水平。
2014年,美国波士顿动力公司研发了第一代阿特拉斯(Atlas),是双足人形机器人,四肢为4个液压所驱动。阿特拉斯由航空级铝和钛制造,身高6英尺(1.8米),重330磅(150千克),用蓝光LED照明。它配备了两个视觉系统,一个激光测距仪和一个立体照相机,由一个机载电脑控制,可在崎岖道路上行走自如。2016年,阿特拉斯升级到能自主搬运东西、开门等,遇到较强冲击力时可以像人类一样,踉跄两步后找到平衡,甚至能在摔倒后站起来。随后,阿特拉斯的技能一路开挂,可以踩碎石、爬雪地、撑竿跳、后空翻,甚至完成高难度体操、跑酷等。美国的特斯拉公司同样在研发人形机器人。2022年10月,特斯拉展示了其人形机器人擎天柱(Optimus),它可以在工厂周围移动部件,用扳手给汽车安装螺栓。擎天柱的下一个奋斗目标是成为用得起的家庭“伙伴”,会做饭、修剪草坪和照顾老人等。
据业界预测,人形机器人应用到工厂的时间是2024年至2027年,应用到消费市场的时间为2028年至2031年。到2035年时,全球人形机器人的产量将达到140万台,市场规模约380亿美元。
但是,在人形机器人全面进入市场之前,还有许多瓶颈需要打通。
在技术上,人形机器人需要进一步改进行为动作,使之与人相似或一样。比如,在蛇年春晚表演结束后,福兮退场是被演员推着走的,有点像“扶老奶奶过马路”。虽然福兮的速度可以达到最快3.3米/秒(人的平均步速是1.48-1.51米/秒),但显然福兮的退场既赶不上人的速度,也达不到高质量的具身智能,即能观察实地情况,像人一样快速退场。此外,人形机器人的有些部件需要高精度磨床,由于其数量有限,导致产量难以提高。同时,人形机器人操控软件(如抓取物体)和交互软件(无需训练即可接收人类的语音指令)的研发仍存在较大的进步空间。
价格是人形机器人的另一个重要瓶颈。目前的人形机器人还处于产业化初期,成本高昂,普遍10万美元起步。未来的人形机器人至少要降至1万美元,才有可能被人们普遍接受。
安全问题也不容忽视。2024年1月,有消息称特斯拉公司的擎天柱袭击了一名工程师,地面还留有血迹。虽被公司认定为谣言,但人们对于人形机器人能否严格遵守“机器人不得伤害人类”的核心准则仍然存疑。另一个敏感的问题就是伦理准则,比如,能否让人形机器人参与战争?但现实情况是,非人形机器人已经在俄乌战场上出现。
也许,当上述所有问题都得到妥善解决时,人形机器人才能为人类提供高质量、高水平、多方面的服务。作为人工智能技术的集成体现,人形机器人是未来产业的一个重要赛道。如今人形机器人的研发如火如荼,它正在飞速发展的科学环境中不断升级,一步步向走进大众生活这个目标靠近。