中国科学院科学家首次证实:大语言模型能像人类一样“理解”事物
创始人
2025-06-11 11:41:16
0

6 月 11 日消息,从中国科学院自动化研究所微信公众号获悉,近日该所神经计算与脑机交互(NeuBCI)课题组与中国科学院脑科学与智能技术卓越创新中心的联合团队结合行为实验与神经影像分析,首次证实多模态大语言模型(MLLMs)能够自发形成与人类高度相似的物体概念表征系统。这项研究不仅为人工智能认知科学开辟了新路径,更为构建类人认知结构的人工智能系统提供了理论框架。相关研究成果以 Human-like object concept representations emerge naturally in multimodal large language models 为题,发表于《自然・机器智能》(Nature Machine Intelligence)。

人类能够对自然界中的物体进行概念化,这一认知能力长期以来被视为人类智能的核心。当我们看到“狗”“汽车”或“苹果”时,不仅能识别它们的物理特征(尺寸、颜色、形状等),还能理解其功能、情感价值和文化意义 —— 这种多维度的概念表征构成了人类认知的基石。

传统人工智能研究聚焦于物体识别准确率,却鲜少探讨模型是否真正“理解”物体含义。论文通讯作者何晖光研究员指出:“当前 AI 能区分猫狗图片,但这种‘识别’与人类‘理解’猫狗的本质区别仍有待揭示。”团队从认知神经科学经典理论出发,设计了一套融合计算建模、行为实验与脑科学的创新范式。研究采用认知心理学经典的“三选一异类识别任务”(triplet odd-one-out),要求大模型与人类从物体概念三元组(来自 1854 种日常概念的任意组合)中选出最不相似的选项。通过分析 470 万次行为判断数据,团队首次构建了 AI 大模型的“概念地图”。

实验范式示意图。a,物体概念集及带有语言描述的图像示例。b-d,分别针对 LLM、MLLM 和人类的行为实验范式和概念嵌入空间。

研究人员从海量大模型行为数据中提取出 66 个“心智维度”,并为这些维度赋予了语义标签。研究发现,这些维度是高度可解释的,且与大脑类别选择区域(如处理面孔的 FFA、处理场景的 PPA、处理躯体的 EBA)的神经活动模式显著相关。

研究还对比了多个模型在行为选择模式上与人类的一致性(Human consistency)。结果显示,多模态大模型(如 Gemini_Pro_Vision、Qwen2_VL)在一致性方面表现更优。此外,研究还揭示了人类在做决策时更倾向于结合视觉特征和语义信息进行判断,而大模型则倾向于依赖语义标签和抽象概念。本研究表明大语言模型并非“随机鹦鹉”,其内部存在着类似人类对现实世界概念的理解。

相关内容

热门资讯

企业数字化转型新契机:为何必须... 在数字经济狂飙突进的时代浪潮下,企业既面临着市场格局重构的严峻挑战,也迎来了弯道超车的战略机遇期。伴...
西安小程序定制开发,从策划到上... 西安小程序定制开发。目前市场上有很多产品类型的小程序不论是模板还是源码,能解决不少用户的需求。但是产...
湖北人形机器人加速“添丁” 7月7日,武汉格蓝若智能机器人有限公司实验室内,工程师们正在对“劳动者”系列人形机器人进行力量和动态...
原创 美... 美日印澳4国外长开会,鲁比奥唱了一出“独角戏”,美对华“包围圈”面临破产,特朗普笑不出来了。 美日印...
原创 神... 神舟二十号乘组在轨找过2个月了,距离返回的时间也在加速之中,这不,对神舟二十一号航天员乘组大家也在讨...
解秘“高标准打造数字龙华”重要... 南都讯 记者张小玲 实习生何昕怡 “全域推进数字化发展,高标准打造数字龙华”作为龙华区今年政府工作报...
泰豪科技获得发明专利授权:“一... 证券之星消息,根据天眼查APP数据显示泰豪科技(600590)新获得一项发明专利授权,专利名为“一种...
湾区速评丨大湾区发展海洋经济 ... 建设海上新广东,最近有了两个新动作:日前,《广东省促进海洋经济高质量发展条例》正式施行;几乎与此同时...
以旧换新,企业为何更愿花钱? 长虹智能制造产业园内,工人正在生产线上忙碌。四川日报全媒体记者 李志强 摄 问题 ●以旧换新拉动消费...
原创 如... 在人生这场漫长的旅程里,每个决定都可能影响咱们未来的日子,尤其是养老问题,那可得好好规划,谨慎对待。...