中国科学院科学家首次证实:大语言模型能像人类一样“理解”事物
创始人
2025-06-11 11:41:16
0

6 月 11 日消息,从中国科学院自动化研究所微信公众号获悉,近日该所神经计算与脑机交互(NeuBCI)课题组与中国科学院脑科学与智能技术卓越创新中心的联合团队结合行为实验与神经影像分析,首次证实多模态大语言模型(MLLMs)能够自发形成与人类高度相似的物体概念表征系统。这项研究不仅为人工智能认知科学开辟了新路径,更为构建类人认知结构的人工智能系统提供了理论框架。相关研究成果以 Human-like object concept representations emerge naturally in multimodal large language models 为题,发表于《自然・机器智能》(Nature Machine Intelligence)。

人类能够对自然界中的物体进行概念化,这一认知能力长期以来被视为人类智能的核心。当我们看到“狗”“汽车”或“苹果”时,不仅能识别它们的物理特征(尺寸、颜色、形状等),还能理解其功能、情感价值和文化意义 —— 这种多维度的概念表征构成了人类认知的基石。

传统人工智能研究聚焦于物体识别准确率,却鲜少探讨模型是否真正“理解”物体含义。论文通讯作者何晖光研究员指出:“当前 AI 能区分猫狗图片,但这种‘识别’与人类‘理解’猫狗的本质区别仍有待揭示。”团队从认知神经科学经典理论出发,设计了一套融合计算建模、行为实验与脑科学的创新范式。研究采用认知心理学经典的“三选一异类识别任务”(triplet odd-one-out),要求大模型与人类从物体概念三元组(来自 1854 种日常概念的任意组合)中选出最不相似的选项。通过分析 470 万次行为判断数据,团队首次构建了 AI 大模型的“概念地图”。

实验范式示意图。a,物体概念集及带有语言描述的图像示例。b-d,分别针对 LLM、MLLM 和人类的行为实验范式和概念嵌入空间。

研究人员从海量大模型行为数据中提取出 66 个“心智维度”,并为这些维度赋予了语义标签。研究发现,这些维度是高度可解释的,且与大脑类别选择区域(如处理面孔的 FFA、处理场景的 PPA、处理躯体的 EBA)的神经活动模式显著相关。

研究还对比了多个模型在行为选择模式上与人类的一致性(Human consistency)。结果显示,多模态大模型(如 Gemini_Pro_Vision、Qwen2_VL)在一致性方面表现更优。此外,研究还揭示了人类在做决策时更倾向于结合视觉特征和语义信息进行判断,而大模型则倾向于依赖语义标签和抽象概念。本研究表明大语言模型并非“随机鹦鹉”,其内部存在着类似人类对现实世界概念的理解。

相关内容

热门资讯

中天科技获得发明专利授权:“具... 证券之星消息,根据天眼查APP数据显示中天科技(600522)新获得一项发明专利授权,专利名为“具有...
原创 为... 前言 说起高铁上的吸烟,可能有不少人会感到震惊,尤其是你了解了日本的新干线时,可能会发现一个令人不...
电力数据“会说话” 点亮智慧新... 本文转自【新华社】 新华社北京8月6日电 《经济参考报》8月6日刊发记者邓林如采写的文章《电力数据“...
Agent独角兽融资7亿,创造... 智东西AI前瞻(公众号:zhidxcomAI) 作者 | 江宇 编辑 | 漠影 智东西8月6日报道,...
一只眼睛近视另一只眼睛正常,为... 很多家长误认为单眼近视不影响生活就不需要干预。但是,若放任单眼近视发展,可能会引发两个问题:一是近视...
Intel反向发布全大核桌面酷... Intel这两天在官网上架了三款 Arrow Lake处理器,分别为 Ultra 5 235A、Ul...
悠自元康复机器人西南总部及研发... 8月5日,四川彭州经开区天府中药城与上海悠自元智能科技有限公司(简称“悠自元”)举行项目合作协议签约...
徐工:全球首台专为储能领域定制... 据徐工集团官微消息,在大型储能企业基地内,全球首台专为储能领域定制的65吨级正面吊已投入使用,徐工正...
具身智能,上海印发重要文件! 上海给具身智能设了一系列目标。 上海市人民政府办公厅8月6日发布《上海市具身智能产业发展实施方案》(...
Cursor CEO访谈:编程... 在人工智能(AI)技术的快速发展中,编程领域正在经历一场前所未有的变革。AI不再仅仅作为辅助工具存在...