人民网记者 李丹
机器人的进化,是技术命题,也是产业命题。
在近期的一场技术展示中,面对“外面下雨了,把雨伞递给我”或“把鸡蛋放在2加3的结果上”的语音指令,一台机器人能够自主完成逻辑计算、目标识别与精准抓取。这直观反映了当前机器人正脱离单一的轨迹执行,向具备感知与决策能力的智能体演进。
针对制造业柔性化生产与自动化升级的迫切需求,切实为工厂“省成本”“省门槛”“省精力”,成为当前具身智能技术发力与落地的方向。
“省成本”——
装上“眼睛”和“大脑”,帮你应对柔性生产的“高代价”。
在工业制造中,布料等柔性易变形物体的处理长期是自动化生产的难点。业界公认,处理此类物体考验的是设备实时动态反馈与微调的能力。
在展厅演示中,面对一件平铺的T恤,双臂机器人的视觉系统能够迅速捕捉轮廓,两只机械臂执行对折、铺平、再对折动作,每一次落爪都伴随视觉的实时反馈与调整。
“这些看似简单的动作,背后是我们在3D视觉、多模态大模型、运动控制等领域长期技术攻关的集中体现。”梅卡曼德创始人兼首席执行官邵天兰告诉记者。从行业视角来看,这类技术进展表明,机器人正逐步适应非结构化环境,为以往难以实现全自动化的生产环节提供了更具性价比的方案。
“省门槛”——
听懂“人话”,让一线工人无需专业编程即可指挥机器。
传统工业机器人的应用长期受限于预设程序与高昂的专业编程门槛。当前,行业正致力于改变这一交互逻辑。
“公司的英文名叫‘Mech-Mind’,意思就是机器人的大脑。”邵天兰向记者介绍公司的核心理念时表示,公司自2016年成立之初,就把研发锚定在机器人的“大脑”上。“我们认为,机器人最重要的不是形态是否像人,而是能够像人一样有眼睛、有大脑,能够感知环境、理解环境并自主做出决策。”
这一理念对应着明确的技术路线:第一步,通过高精度、高速3D相机,让机器人获得“眼睛”去感知环境;第二步,通过人工智能算法让机器人理解环境;第三步,通过视觉模型、动作模型等方式训练机器人自主做出动作。
依托自主研发的Mech-GPT多模态大模型,用户只需自然语言指令,无需专业编程知识,即可让机器人完成复杂任务。这种从代码到自然语言的转变,大幅降低了企业部署与操作机器人的技术门槛。
“省精力”——
对接产线与生态,让你能找到“靠谱的”智能化支持。
技术成果需要通过真实产业场景检验。“当前汽车产业迫切需要具身智能带来更加灵活、柔性、更具性价比的智能制造方案。”邵天兰说。基于这一产业逻辑,该团队将汽车制造作为主要应用方向。
目前,其技术方案已在冲压、焊接、喷涂、总装、电池等工序中实现批量应用,服务客户包括丰田、比亚迪、吉利、上汽通用五菱等超过100家《财富》500强企业。
为了进一步提供“靠谱的”支持,今年3月,梅卡曼德(天津)机器人科技有限公司在西青天开数智园正式投入运营;4月,其位于同一园区的“汽车智造与具身智能实验室”正式揭牌,聚焦汽车产业智能化核心需求,打造技术研发、成果转化、场景验证一体化的创新平台。
“天津有很多外资企业和开展进出口业务的公司,这非常有利于我们‘走出去’。西青区各级部门的大力支持,让我们能够全身心投入研发生产。”邵天兰表示。作为一家大约一半业务来自海外的国际化公司,其天津公司目前已接到海外客户的订单。
从解决机器“能不能看懂”,到思考“方不方便用、能不能落地”,具身智能行业正逐步接近大规模实际应用。“我认为具身智能当前正在迎来一个非常大的拐点。”邵天兰说,“随着AI模型、相关硬件以及应用场景数据积累等要素的进步,具身智能已经很接近大规模实际应用了。”
但行业仍面临长期挑战。邵天兰坦言:“相比客户总的潜在需求,我们当前解决的仍然只是很小一部分。剩下的部分需要我们和产业链合作伙伴一起,从机器人的智能程度、方案设计、终端客户打磨、联合训练等多个方面来提升。”这表明,推动产业链的协同发力,仍是行业走向规模化应用的关键。