科大讯飞想做人形机器人公司的“卖铲人”
创始人
2024-07-08 19:21:15
0

6月底的科大讯飞星火大模型4.0版本发布会上,一款名为“机器人超脑平台”的产品推出升级版,但得到的曝光时间不足2分钟。不过这款产品的一大目标客户群,当前正置身火热的AI“淘金”风口:人形机器人。

科大讯飞开放平台研发总监刘可为负责“机器人超脑平台”的研发。近日接受南都记者采访时他介绍说,这款产品主要服务于机器人的“头脑”运转。相较于传统智能硬件的收音方案和直接调用通用大模型的已有做法,科大讯飞提供一套软硬件一体的集成方案:端侧融合麦克风和摄像头,以视听融合的方式用于机器人的感知与交互;云端则以星火大模型为底座构建机器人“大脑”,实现指令的理解与决策。

人形机器人开展任务执行的前提,是能够准确接收人类发出的讯号。刘可为说,不同于传统机器人可通过触控或者遥控的方式控制,人形机器人更多以语音作为主要的交互形式。为了应对嘈杂环境下的降噪需求,科大讯飞从两个方面入手处理:声学结构方面,在人形机器人的身体前后安装各4个麦克风,进行360度声源定位;降噪算法上,在麦克风阵列基础上增加一个摄像头,识别人脸和嘴唇。结合唇形检测、音频特征提取和目标跟踪,机器人能判断和追踪该特定对象的说话语音,屏蔽杂音。

听觉灵敏的需求之外,人机对话的顺畅运行还离不开机器人“大脑”的理解和决策性能。“机器人超脑平台”将这部分任务交给讯飞星火大模型,让机器人理解复杂问题,在应用场景中完成指令识别、专业知识的问答和陪伴闲聊。

对话输出能力尤其关乎人形机器人在商用和家用场景的落地。人形机器人厂商目前的研发重心多落脚在运动能力提升,但刘可为认为,当运动问题逐步解决之后,人机交互问题将成为下一项重要关切。科大讯飞对此的做法是以讯飞星火大模型为底座,针对人机交互场景定制优化,合成输出拟人化的口语表达,而不是让人产生疏离感的完美无瑕声音。

据刘可为介绍,目前已有410家机器人企业采用了“机器人超脑平台”方案,覆盖国内约六成的人形机器人厂商,包括优必选、宇树科技、智元机器人、银河通用、人形机器人创新中心(上海)等头部玩家。

星火大模型4.0版本发布会上列出的代表客户

6月14日,人形机器人“独角兽”企业智元机器人公司和科大讯飞签订战略合作协议。公开信息披露,此次科大讯飞与智元机器人的战略合作,将为讯飞机器人超脑平台带来更为丰富的应用场景和实验数据。双方还会探索建立人形机器人语音交互技术标准。

刘可为表示,科大讯飞与机器人厂家的合作主要集中在两个方面:一是将“机器人超脑平台”嵌入人形机器人本体,打磨和优化产品的效果;另一方面则是探索人形机器人在实际业务场景下的落地,推动人形机器人的商业化进程。

科大讯飞也试图借助和人形机器人公司的合作,获得技术等层面的反馈。刘可为说,机器人本体用上“超脑平台”之后,能产生许多实际业务场景中的操作数据,可以用来分析和优化算法的性能,进而提升机器人的响应速度和交互执行的准确性。此外,有时候机器人厂商对“机器人超脑平台”提出定制化需求,讯飞如果研判此种需求具备通用性,会将该功能予以标准化。

采写:南都见习记者 杨柳

相关内容

热门资讯

工信部按规定组织完成型号核准工... 11月29日消息,据工信部网站消息,11月26日,华为Mate系列智能手机正式发布。工业和信息化部无...
国内期货主力合约涨跌不一,丁二... 11月29日消息,国内期货主力合约涨跌不一,丁二烯橡胶涨近3%,白糖、20号胶(NR)、棕榈油、橡胶...
罢工员工遭解雇,加拿大邮政劳资... 11月29日消息,当地时间11月28日,代表加拿大邮政工人的工会在给会员发送的一份通知中说,自邮政工...
加拿大竞争局起诉谷歌,指其在线... 11月29日消息,当地时间11月28日,加拿大竞争局发布声明称,该局正在就谷歌在加拿大在线广告技术服...
供大于求格局笼罩,生猪市场旺季... 11月29日消息,8月中旬以来,生猪价格开启下滑通道,即使11月传统需求旺季来临,也未能改变这一态势...
从幽州到南京,古代北京如何从“... 至少自商代后期就已存在的蓟国之都蓟城,在周朝相继做了蓟国与燕国的都城,秦汉至隋唐时期一直是中国北方军...
普通人如何在"战争溢... 最近中东那边又炸了。 美国和以色列对伊朗发动军事袭击,英法德相继宣布参战,伊朗则直接宣布关闭霍尔木兹...
定增市场显著回暖,基金公司积极... 11月29日消息,进入四季度以来,A股定增市场明显回暖。Wind数据显示,截至记者发稿,今年10月份...
马斯达尔完成收购特尔纳能源的交... 11月29日消息,阿布扎比未来能源公司PJSC–Masdar(马斯达尔)宣布,已成功完成从GEK T...
盛松成:降准、降息仍有空间 11月28日消息,中欧国际工商学院经济学与金融学教授盛松成今日在一场演讲中表示,“我认为,未来一段时...