研究称AI 越聪明越有可能“胡编乱造”
创始人
2024-09-30 02:20:43
0

据媒体援引一项新研究表示,随着大型语言模型(LLM)变得越来越强大,它们似乎也越来越容易编造事实,而不是避免或拒绝回答它们无法回答的问题。这表明,这些更聪明的 AI 聊天机器人实际上变得不太可靠。

该研究发表在《自然》杂志上,研究人员研究了一些业界领先的商业 LLM:OpenAI 的 GPT 和 Meta 的 LLaMA,以及由研究小组 BigScience 创建的开源模型 BLOOM。研究发现,虽然这些 LLM 的回答在许多情况下变得更加准确,但总体上可靠性更差,给出错误答案的比例比旧模型更高。

瓦伦西亚人工智能研究所在西班牙的研究员 José Hernández-Orallo 对《自然》杂志表示:“如今,它们几乎可以回答一切。这意味着更多正确的答案,但也意味着更多错误的答案。”

相关内容

热门资讯

2026年湖北隧道UWB定位系... 湖北隧道UWB定位系统是面向地下隧道工程内人员与设备实时位置感知的技术系统,通过超宽带无线通信实现厘...
计算机网络技术,哪所学校的实践... 在当今数字化飞速发展的时代,计算机网络技术作为信息技术的核心领域之一,其重要性不言而喻。无论是企业、...
Claude最强模型全球禁用 ... 来源:市场资讯 (来源:贝壳财经) 新京报贝壳财经讯 (记者罗亦丹)北京时间6月13日,Anthro...
2026医疗康复与养老服务机器... 6月12日,2026医疗康复与养老服务机器人创新应用交流对接会在无锡顺利举办。本次会议由中国机电一体...
原创 化... 化学反应的实质不仅体现在物质的转化上,更伴随着能量的转移与转换。我们可以将化学反应过程视为物质内部能...
原创 中... 咱们的探测器都好几次去月球转过圈、还带回了月壤,怎么轮到载人登月,反倒不慌不忙定在2030年前? 这...
歌尔申请虚拟现实设备自动调节焦... 国家知识产权局信息显示,歌尔股份有限公司申请一项名为“显示方法、装置、虚拟现实设备及存储介质”的专利...
阿里周靖人,六天的首席 01 还没捂热的头衔 2026年6月13日,整个AI圈都在讨论一个数字:6。 6月8日,阿里巴巴宣布...
走出实验室,机器人如何“上岗”... “机器人真的走出实验室,正式上岗了吗?”近日,“活力中国调研行”记者团在北京多处走访探索答案。 “小...
3分钟了解!德州局透视,wep... 3分钟了解!德州局透视,wepokerh5破解,方针教程(了解有挂)1、进入到wepokerh5破解...