双向奔赴:机器人或成人工智能领域“弄潮儿”
创始人
2024-06-01 15:40:55
0

科技日报记者 刘霞

观看《星球大战》长大的一代人可能会感到失望,他们目光所及之处,仍看不到C-3PO类机器人的影子。那些预想中具有常识、能在家里和职场为人类提供帮助的人形机器人何时会出现?

人工智能(AI)的快速发展或许很快会填补这一空白。

人形机器人使用OpenAI编程获得语言和视觉。

图片来源:《自然》网站

《自然》网站近日报道指出,AI和机器人技术“联姻”,可能是一场将彼此推向新高度的“双向奔赴”。AI给机器人灌输常识,让其能像人一样处理各种任务;机器人则利用身体经验,帮助AI跃升为“通用AI”。但专家提醒,这条双向奔赴之路仍面临诸多挑战,包括收集海量精准数据供机器人学习、应对“喜怒无常”的硬件、解决安全问题等。

基础模型助机器人“更聪明”

众多机器人领域的AI科学家都希望,未来机器人能在更广泛环境中自主适应。例如,会帮顾客挑选产品的机械臂,能陪伴老人的智能人形机器人等。

当看到提示“挑选灭绝动物”时,谷歌的RT-2选择了恐龙雕像。

图片来源:谷歌“深度思维”公司

然而,控制这类机器人绝非易事。从OpenAI到谷歌“深度思维”公司,都致力于将多功能学习算法(基础模型)嵌入机器人,以便其在聊天时表现得更像人类。这些想法的核心是给机器人灌输常识,使之能胜任各种任务。英伟达公司机器人技术营销专家杰拉德·安德鲁斯强调,机器人技术目前正处于变革的关键时刻。该公司于3月推出了一款专为人形机器人设计的通用AI模型。谷歌“深度思维”公司则创建了现有最先进的机器人基础模型之一RT-2,其可以认出明星的照片,尽管之前受到的训练中该明星并未出现过。

研究人员乐观地认为,基础模型有助科学家研发出可以辅助人类劳动的通用机器人。今年2月,人形机器人公司筹集6.75亿美元,以在通用人形机器人中应用OpenAI开发的语言和视觉模型。一段视频显示,机器人给人一个苹果,以回应人们“吃东西”的要求。

多样数据让机器人“更有经验”

尽管聊天机器人正在接受来自互联网数十亿单词训练,但机器人活动的数据集还远远不够。

数据汇集或是一种解决方法。美国斯坦福大学机器人研究专家亚历山大·卡哈扎特斯基及其同事创建了开源数据集DROID2,汇集了德国Franka Robotics公司制造的Franka Panda 7DoF机械臂约350小时的视频数据,包括浴室、洗衣房、卧室等数百种环境的记录。这种多样性有助机器人在全新环境下更好地执行任务。

加州AI公司Covariant也在努力扩大机器人数据的规模。该公司于2018年开始从世界各地的30种机械臂中收集数据,其“机器人基础模型1”(RFM-1)不仅收集视频数据,还收集传感器读数。此类数据对于提升机器人任务执行能力至关重要,比如让机器人知道如何不碰伤香蕉。

此外,许多专家正致力于构建3D虚拟现实环境,旨在通过这些环境来训练机器人。元宇宙平台(Meta)和英伟达都在模拟领域投入大量资源,以扩大机器人数据的规模,并建立了复杂的模拟世界b。通过这些平台,机器人能够在短短几个小时内积累相当于多年实际经验的数据。

硬件和安全问题需考虑

许多机器人专家指出,尽管AI给了机器人更智慧的“大脑”,但其进一步发展仍面临诸多挑战。机器人很复杂,而且硬件很容易损坏。

新加坡国立大学人机交互专家哈罗德·索赫说,机器人可能需要大量其他类型的数据,如触觉或本体感觉(身体在空间中的位置感)数据。这类数据集目前还不存在,但这是人形机器人高效工作所必需。

安全性必须认真考量。大型语言模型已被证明会产生错误、偏见,也可能诱骗人类或机器人做一些“坏事”。鉴于此,研发人员需要给机器人AI模型中植入一些规则。机器人无疑仍需要大量人工监督。

尽管存在一定风险,但AI与机器人的这场双向奔赴仍值得期待。而AI通过与机器人相结合,增加与现实世界互动,有望超越学习模式做出预测,真正理解和推理世界。

相关内容

热门资讯

技术本善、用户为本,长城汽车重... 2025年12月16日,保定长城汽车技术中心,长城欧拉5正式上市。与常规发布会不同,这场上市活动同步...
新农人:西云数据如何绘制智慧农... 在数字化浪潮席卷全球的今天,农牧业正在经历一场从“泥土”到“云端”的深刻变革。无论是广袤田野里的春耕...
原创 科... 新近发现的一种非编码RNA基因作为细胞尺寸的主控开关,为理解疾病与发育过程提供了全新视角。 长久以...
原创 为... 近日,中日两国再度因军事和意识形态问题尖锐对峙,网络上充斥着日本右翼分子的叫嚣与中国军事实力的质疑。...
大模型真懂你吗?杨立昆最新论辩... 大语言模型真的“理解”我们说的话吗?它们有没有意识?它们是通往通用人工智能的跳板,还是只是出色的语言...
城市治理的升级路线:从系统工程... 当机器人开始被要求在公共场景里7×24小时运行,产业逻辑会迅速从“设备是否好看”转向“系统是否扛用”...
很强!人形机器人VLA 驱动全... 让人形机器人能够像人一样完成装箱、搬运、推车等移动操作任务,一直是人们对具身智能的期待。近日,来自香...
原创 哈... 1、小伙子见女友正在翻阅一本《爱情与婚姻》杂志,便讨好地问道:“亲爱的,你喜欢这本杂志的哪个栏目?”...
2025年Q3移动互联网行业数... 今天分享的是:2025年Q3移动互联网行业数据研究报告 报告共计:49页 2025年第三季度,中国移...