中国科学院科学家首次证实:大语言模型能像人类一样“理解”事物
创始人
2025-06-11 11:41:16
0

6 月 11 日消息,从中国科学院自动化研究所微信公众号获悉,近日该所神经计算与脑机交互(NeuBCI)课题组与中国科学院脑科学与智能技术卓越创新中心的联合团队结合行为实验与神经影像分析,首次证实多模态大语言模型(MLLMs)能够自发形成与人类高度相似的物体概念表征系统。这项研究不仅为人工智能认知科学开辟了新路径,更为构建类人认知结构的人工智能系统提供了理论框架。相关研究成果以 Human-like object concept representations emerge naturally in multimodal large language models 为题,发表于《自然・机器智能》(Nature Machine Intelligence)。

人类能够对自然界中的物体进行概念化,这一认知能力长期以来被视为人类智能的核心。当我们看到“狗”“汽车”或“苹果”时,不仅能识别它们的物理特征(尺寸、颜色、形状等),还能理解其功能、情感价值和文化意义 —— 这种多维度的概念表征构成了人类认知的基石。

传统人工智能研究聚焦于物体识别准确率,却鲜少探讨模型是否真正“理解”物体含义。论文通讯作者何晖光研究员指出:“当前 AI 能区分猫狗图片,但这种‘识别’与人类‘理解’猫狗的本质区别仍有待揭示。”团队从认知神经科学经典理论出发,设计了一套融合计算建模、行为实验与脑科学的创新范式。研究采用认知心理学经典的“三选一异类识别任务”(triplet odd-one-out),要求大模型与人类从物体概念三元组(来自 1854 种日常概念的任意组合)中选出最不相似的选项。通过分析 470 万次行为判断数据,团队首次构建了 AI 大模型的“概念地图”。

实验范式示意图。a,物体概念集及带有语言描述的图像示例。b-d,分别针对 LLM、MLLM 和人类的行为实验范式和概念嵌入空间。

研究人员从海量大模型行为数据中提取出 66 个“心智维度”,并为这些维度赋予了语义标签。研究发现,这些维度是高度可解释的,且与大脑类别选择区域(如处理面孔的 FFA、处理场景的 PPA、处理躯体的 EBA)的神经活动模式显著相关。

研究还对比了多个模型在行为选择模式上与人类的一致性(Human consistency)。结果显示,多模态大模型(如 Gemini_Pro_Vision、Qwen2_VL)在一致性方面表现更优。此外,研究还揭示了人类在做决策时更倾向于结合视觉特征和语义信息进行判断,而大模型则倾向于依赖语义标签和抽象概念。本研究表明大语言模型并非“随机鹦鹉”,其内部存在着类似人类对现实世界概念的理解。

相关内容

热门资讯

为切实保障!微信微乐有挂没有,... 为切实保障!微信微乐有挂没有,新二号辅助器软件多少钱(竟然是有挂)-哔哩哔哩1、点击下载安装,新二号...
北京口岸迎假日出入境高峰,单日... 10月7日消息,伴随国庆中秋双节长假步入尾声,北京口岸于10月7日起正式迎来返程客流高峰。据北京边检...
台交所加权股价指数收涨1.68... 10月7日消息,台交所加权股价指数收涨1.68%,报27211.95点,再创收盘历史高位。(科股宝播...
日股微涨,日经225指数、东证... 10月7日消息,日股微涨,日经225指数、东证指数均续创历史收盘新高。日经225指数收盘涨0.01%...
现货白银日内跌幅扩大至1%,报... 10月7日消息,现货白银日内跌幅扩大至1%,报48.0美元/盎司。纽约期银日内跌幅达1%,现报47....
为切实保障"wepo... 为切实保障"wepoker怎么看底牌"wepoker透视脚本网页(一贯是真的辅助app)-哔哩哔哩1...
有消息称!麻雀智能辅助软件开挂... 有消息称!麻雀智能辅助软件开挂,hhpoker辅助靠谱吗(透视)一直是真的有辅助攻略(哔哩哔哩)1、...
这一现象值得深思!欢欢辅助软件... 这一现象值得深思!欢欢辅助软件怎么样,泉州相约十三水辅助(真是是有神器)-哔哩哔哩泉州相约十三水辅助...
透视挂透视"wepo... 透视挂透视"wepoker轻量版透视系统"hardrock作必弊(总是存在有辅助平台)-哔哩哔哩一、...
据目击者称!乐酷辅助图片,we... 据目击者称!乐酷辅助图片,wepoker分析(透视)竟然真的有辅助教程(哔哩哔哩)1、完成乐酷辅助图...