学术期刊领域正面临一大难题:一些论文中的图片可能是被篡改或伪造过的。为了解决这一问题,学术出版商开始使用人工智能技术来检测和辨别这些可疑图片。
然而,正当他们努力应对此问题之时,另一个问题也开始引起关注:生成式人工智能可能为图片欺诈行为提供了新的手段。
近来,针对研究人员的指责不断增加,他们的论文中可能存在图像篡改的迹象,其中一些甚至是几年前发表的。
一些”科学侦探”正在利用他们训练有素的眼睛,以及基于人工智能的商业软件,来发现论文中可能存在的图像重复和其他问题,这些问题可能暗示着记录不精确甚至更糟糕的情况。他们将这些担忧公之于众,比如在 PubPeer 这样的在线论坛上——这个论坛每天都会有许多新帖子标记着图像问题。
这些调查结果逐渐浮出水面。例如,上个月,位于美国波士顿的达纳-法伯癌症研究所(Dana-Farber Cancer Institute,DFCI)表示,他们将要求期刊撤回或更正一些由他们研究所的员工撰写的论文。这一决定是在一名观察员提出对论文中图像问题的担忧后作出的。该研究所正在继续调查这些问题。
这起事件只是众多类似事件中的一个。面对公众的审查,学术期刊越来越多地采用各种技巧和工具在论文发表之前发现问题图像,包括商业人工智能系统。在这篇文章中,我们将回顾这一问题,并探讨出版商如何解决它。
都有哪些图像问题被发现了?
图像欺诈行为包括在多个图表中使用相同的数据、复制照片细节或部分照片细节,以及删除或拼接图像。这些情况可能是有意为之,也可能是出于试图改善图形美观度的无辜尝试。然而,专家表示,即使是无辜的错误也可能对科学的完整性造成损害。
这些问题有多普遍,是否呈上升趋势?
这类问题的确切数量尚不清楚。网站“撤稿观察”(Retraction Watch)维护的数据库已有超过51000起撤稿和更正,其中大约有4%涉及到图片欺诈问题。一项由旧金山科学图像侦查员Elisabeth Bik及其同事进行的大规模量化努力发现,近4%的论文中包含有问题的图表。该研究还揭示了另一项趋势:自2003年左右开始,图像的不当复制行为开始增加。这可能是因为数字摄影的普及使修改照片变得更加容易。
Bik指出,现如今,论文中的图片数量比几十年前多。“再加上每天发表的论文数量比十年前多得多,以及科学家面临的发表压力增加,问题的发现就会更加频繁。”
来自PLOS出版伦理团队成员Renee Hoch也表示,举报率高可能是因为全球对科研诚信问题的关注度增加了。
在达纳-法伯癌症研究所发生了什么?
今年一月,来自英国庞蒂普里德的生物学家和调查员Sholto David在他的博客中提到,达纳-法伯癌症研究所的科学家们发表的50多篇生物学论文可能存在的图像篡改问题。该研究所是哈佛大学的一个分支机构。这些论文的作者包括达纳-法伯癌症研究所所长劳里·格林彻(Laurie Glimcher)和她的副手威廉·汉(William Hahn);然而,达纳-法伯癌症研究所的发言人拒绝对此发表评论。David的博客指出了近20年来这些论文中似乎存在的图像重复或其他异常情况。这篇博客最初被哈佛校报《哈佛深红报》(The Harvard Crimson)报道。
达纳-法伯癌症研究所已经开始调查其中一些问题,并正试图撤回一些论文并对其他论文进行更正。该研究所的研究诚信官员巴雷特·罗林斯表示,“尽快纠正科学记录对于拥有强大研究诚信的机构来说是非常重要的,并且是一种常见的做法”。
“需要强调的是,论文中存在图像重复或差异并不意味着作者有欺骗意图,”他补充道。
期刊为改善图像诚信做了哪些工作?
为了减少发布处理不当的图像,一些期刊,包括《细胞科学杂志》(Journal of Cell Science)、《PLOS生物学》(PLOS Biology )和《PLOS ONE》要求作者在提交论文的同时提供原始图像,而不仅仅是他们论文图表中经裁剪或处理过的图像。
许多出版商还将人工智能工具,如ImageTwin、ImaCheck和Proofig,纳入定期的出版前检查中。《科学》系列期刊在今年一月宣布正在使用Proofig对所有提交的稿件进行筛查。《科学》系列期刊的主编霍尔登·索普(Holden Thorp)表示,Proofig已经发现了一些导致编辑决定不予发表的问题。他说,作者通常会感激有人指出他们的错误。
这些基于人工智能的系统能够发现哪些问题?
所有这些系统都能够快速检测出同一篇论文中的图像重复,即使这些图像已经被旋转、拉伸、裁剪或改变颜色。
不同的系统有不同的优点。例如,Proofig可以发现通过切割或拼接图像部分而创建的拼接线。Bik表示,ImageTwin的优点在于允许用户与大量其他论文的数据集进行交叉检查。一些出版商,包括斯普林格·自然(Springer Nature),正在开发自己的AI图像诚信软件。
有些AI工具标记的错误似乎是无心的。在提交给美国癌症研究协会(American Association for Cancer Research)的9个期刊的超过1300篇论文的研究中,Proofig标记了15%的可能存在图像重复的论文,需要与作者进行后续沟通。作者的回应表明,其中28%的重复是有意为之的,例如,作者使用同一张图像来说明多个观点。63%是无意的错误。
这些AI系统的工作效果如何?
用户报告称,人工智能系统确实能更快发现某些类型的图像问题。《临床调查杂志》在2021年至2022年试用了Proofig,发现它将可能存在问题图像的手稿比例从1%提高到了3%。
但是,Bik表示,这些工具不太容易发现那些更为复杂的篡改或AI生成的伪造。《欧洲分子生物学会报告》(EMBO Reports)的首席编辑本德·普尔韦勒(Bernd Pulverer)说,这些工具“能检测基本错误和低级别的诚信违规行为,但这只是大问题的一个小方面。”“现有工具最多只能显示冰山一角,目前的方法很快将变得基本过时。”
出版前检查是否遏制了图像问题?
专家团队、技术工具和加强警惕的结合似乎是有效的——至少目前是这样。“我们已经连续十多年进行了系统的筛查,现在首次看到检测率在下降,”普尔韦勒说。
但是,随着图像篡改变得更加复杂,要发现这些问题,将变得越来越困难,他说:“几年后,我们当前的图像诚信筛查仍将对过滤错误有用,但肯定不适用于检测欺诈。”
长期来看,
如何以更好的办法应对图像篡改?
Bik认为,要彻底解决图像篡改问题,需要对科研工作方式进行复杂的改革,更加注重严谨性和可重复性,同时对不端行为进行严厉惩罚。“我们听到太多关于实验室里存在着欺凌和研究主管花费太少时间的故事,这会让大家认为:学术欺诈是可以被接受的行为,”她说,“这种状况必须得到改变。”
由此来看,在面对图像篡改问题时,学术期刊和研究机构都采取了一系列措施,包括利用人工智能技术以及加强对作者的审核和监督。尽管目前的方法可以在一定程度上发现和纠正图像篡改,但问题的根源仍需要我们深入思考和解决。只有在整个科研生态系统中形成了共识和行动,我们才能真正有效地应对图像篡改等学术不端行为,维护科学的诚信和品质。
原文链接:https://www.nature.com/articles/d41586-024-00372-6
图片来源:Shutterstock
封面图:Shutterstock
如有侵权,请联系本账号删除
中文知识网
欢迎关注我们!
将中文知识网设为星标账户,可第一时间收到推送哦~