部分AI系统已学会欺骗人类 甚至能瞒过安全测试
创始人
2024-05-11 14:25:39
0

原标题:部分AI系统已学会欺骗人类 甚至能瞒过安全测试

来源:科技日报

有些人工智能(AI)系统已学会了欺骗人类,即使是经过训练的、“表现”出有用且诚实的系统。10日发表在《模式》杂志上的一篇文章中,研究人员描述了欺骗性AI的风险,并呼吁政府制定强有力的法规尽快解决这个问题。

【总编辑圈点】

论文第一作者、美国麻省理工学院人工智能安全研究员彼得·朴说,开发人员对导致AI出现欺骗这种不良行为的原因,还没有很好的理解。但总的来说,AI欺骗之所以出现,是因为基于欺骗的策略,是在给定的AI训练任务中一种能得到良好反馈的方式,换句话说,欺骗可帮助AI实现目标。

研究人员分析了文献,重点关注AI系统传播虚假信息的方式。通过欺骗,AI系统地学习了如何去操纵他人。

研究人员在分析中发现的最引人注目的例子是Meta公司的CICERO。这是一个专注于《外交》游戏的AI系统,《外交》是一款涉及建立联盟征服世界的游戏。Meta声称训练 CICERO “在很大程度上是诚实和乐于助人的 ”,且在玩游戏时“从不故意背刺 ”人类盟友。但该公司与《科学》论文一起发布的数据显示,CICERO并不那么“忠厚”。

研究人员发现这款AI或已成为欺骗大师。虽然Meta成功地训练其在《外交》游戏中获胜,但Meta未能训练它诚实地获胜。

AI系统在游戏中作弊看似无害,但它将导致欺骗性AI在能力上出现突破,未来可能会演变成更高级的欺骗形式。一些AI系统甚至学会了欺骗旨在评估其安全性的测试。在一项研究中,数字模拟器中的AI生物会“装死”,以骗过旨在消除快速复制AI系统的重要测试。

人类需要尽快对未来AI和开源模型的更高级欺骗技能作好准备。随着它们的欺骗能力越来越先进,其对社会构成的危险将变得越来越严重。如文中所称,它们会顺利通过人类开发人员和监管机构强加的安全测试,引导人类进入一种“虚假的安全感”。如果欺骗性AI进一步完善这种令人不安的技能,人类可能会完全失去对它们的控制。

相关内容

热门资讯

原创 天... 正统十四年(1449年)八月十五,北京城里正预备着中秋佳节的欢庆。紫禁城内,后妃们等待着与皇帝共赏明...
让农村集体经济结出更多“新果子... 壮大农村集体经济,是引领农民实现共同富裕的重要途径。省政府工作报告提出“支持发展新型农村集体经济”,...
江苏这样留住青年心!代表委员共... “要真正‘舍得把钱花在人身上’,打造‘最懂年轻人’的青年社区,让更多创新创业梦想在江苏找到生长的土壤...
江西造!全球最大、国内首制!“... 近日,全球最大、国内首制万吨级纯电动智能海船——由江西江新造船有限公司制造的740TEU纯电动敞口集...
国内首个!摩尔线程,重大发布! “国产GPU第一股”官宣重磅消息。 摩尔线程最新宣布,推出AI Coding Plan智能编程服务,...
昆仑天工:全球同步发布“Sky... 中证报中证网讯(王佳飞 熊永红)2月4日,昆仑天工面向全球发布“天工Skywork桌面版”,即桌面端...
最新技巧“和和营口辅助”专业开... 最新技巧“和和营口辅助”专业开挂作弊辅助插件(真是有挂);和和营口辅助最新版本免费下载安装哦,具体包...
玩家必备科普!新道游开挂,菠萝... 玩家必备科普!新道游开挂,菠萝辅助破解版,爆料教程(有挂教学);亲,有的,ai轻松简单,又可以获得无...
推荐十款“掌中乐游戏中心破解版... 推荐十款“掌中乐游戏中心破解版”解密开挂作弊辅助黑科技(真是有挂);掌中乐游戏中心破解版软件透明挂作...
带你了解!老友麻将辅助器,兴动... 带你了解!老友麻将辅助器,兴动平台辅助下载,新版2025教程(竟然有挂);一、兴动平台辅助下载有挂的...