“AI科学家”登场,科研自动化时代来了?
创始人
2024-09-12 22:41:33
0

科研过程可以完全自动化吗?一个研究机器学习的国际团队正在勇闯“无人区”。

据《自然》网站近日报道,日本Sakana AI公司和加拿大、英国科学家携手,创建了一种基于大语言模型的“人工智能(AI)科学家”。从阅读文献到提出新假设,再到尝试各种解决方案并撰写论文,整个研究周期,“AI科学家”能一气呵成。

Sakana公司在其官网表示,这位科研“新星”是首个用于自动化科研和开放式发现的综合AI系统,标志着科学发现新时代的开始。尽管它展现出非凡的潜力,但目前并不完美,应警惕“AI科学家”被滥用的风险。

推进流程行云流水

AI技术不断进步,让科学家能借助一些模型来集思广益或编写代码。然而,这些模型仍然需要大量人工监督,或仅囿于执行特定任务。

那么,能否利用基础模型将整个科研过程自动化呢?包括加拿大不列颠哥伦比亚大学机器学习专家在内的团队,成功创建出首位“AI科学家”。

在想法生成阶段,该“AI科学家”基于一个起始模板,先进行“头脑风暴”,提出多个不同研究方向,并进行广泛搜索,以确保某些想法是新颖且有趣的;在实验迭代阶段,对于第一阶段提出的某个想法,“AI科学家”会先开展实验,然后生成图表可视化结果,并给每个图表添加注释;在论文写作阶段,它会模仿标准机器学习会议的风格,撰写出一份文字简练、内容丰富的论文,并自主查找相关论文进行引用;在自动化同行评审阶段,研究团队开发出一个自动化的“AI审稿人”,其评估生成论文的准确性堪与人类相媲美。评估结果和建议可用于改进该项目,实现持续的反馈循环,使“AI科学家”能够迭代改进其研究成果。

在最初的演示中,该“AI科学家”针对扩散模型、Transformer模型(一种用于处理语言数据的神经网络模型),以及AI“领悟”(grokking)等机器学习子领域进行了深入研究,总共生成了10篇论文,每篇论文的成本约15美元。

美国华盛顿大学计算社会科学家杰文·韦斯特表示,该“AI科学家”行云流水般完成了整个科研流程,令人印象深刻,有望加速科学发现的步伐。

功能远非尽善尽美

尽管这位“AI科学家”潜能巨大,但它远非尽善尽美。

Sakana AI公司指出,“AI科学家”目前还不具备视觉功能,因此无法修复论文中出现的图表问题。例如,它生成的图表有时无法读取,表格有时会超出页面范围,页面布局也并不美观。

此外,该“AI科学家”有时会出现想法正确但执行错误的情况,也会因比较不当而生成误导性的结果。在撰写论文和评估结论时,它还可能会犯严重错误。例如,它很难比较两个数字的大小,这是大语言模型的“通病”。为了部分解决这个问题,研究团队确保所有实验结果都可以重复,并存储了所有执行文件。

研究人员预计,未来多模态模型“加入战局”,将助该“AI科学家”一臂之力。

另外,该“AI科学家”只能开展机器学习领域的研究,且缺乏科研过程的关键部分:动手进行实验的能力。

艾伦人工智能研究所计算机科学家汤姆·霍普表示,目前该大语言模型“仍无法提出并制定新颖有用的科学方向”。劳伦斯伯克利国家实验室材料科学家赫布兰德·希德则认为,即使该系统在短期内无法完成更具创造性的工作,仍可将科研过程中一些重复性内容自动化。

Sakana AI也强调,此类系统能否提出真正的变革型想法仍未有定论。未来的“AI科学家”能否发明出像人工神经网络或信息论一样的概念也还是个未知数。

能力越强越需慎用

研究人员表示,为扩大该“AI科学家”的能力,让其能够研究更抽象的领域,如纯数学领域,可能需要调遣语言模型之外的其他技术。

例如,解决数学问题需要逻辑推理,而目前大多数AI模型都不擅长逻辑推理。鉴于此,谷歌深度思维公司开发出AlphaGeometr,将语言模型与符号引擎(使用符号和逻辑规则进行推理)相结合,构建出一种神经—符号混合系统。在今年的奥林匹克数学竞赛中,升级后的AlphaGeometry2在19秒内就解答出一道题,令人类选手望尘莫及。

研究人员坚信,目前的迭代只是个开始。“AI科学家”就像AI科研自动化领域的GPT-1。随着不断迭代,它将如目前的GPT-4一样,引发新的科研革命。

不过,与许多新技术一样,“AI科学家”也打开了“潘多拉魔盒”,甚至可能被滥用。

譬如,“AI 科学家”能自动创建论文并提交,这将显著增加审稿人的工作量,可能阻碍科学质量控制,并给学术进步带来压力。而且,“AI科学家”还可能被用来制造危险的病毒,给人类社会带来潜在危害。(科技日报 刘霞)

本网站转载的所有的文章、图片、音频视频文件等资料的版权归版权所有人所有。如因无法联系到作者侵犯到您的权益,请与本网站联系,我们将采取适当措施。

相关内容

热门资讯

卢伟冰直播回应:小米不是蹭苹果... 小米集团总裁卢伟冰9月19日晚在直播中谈及小米17系列背后的故事。 日前,关于“该产品命名为什么跳过...
京渝两家蜡像馆关闭,传统景区如... 前不久北京杜莎夫人蜡像馆官宣永久关闭,而5月份重庆杜莎夫人蜡像馆已经闭园,连续两家景区“打烊”,为景...
深读|中山滨海旅游如何“热”起... 国庆、中秋双节临近,中山翠亨新区的滨海步道旁,新文旅项目的重磅消息呼之欲出。马鞍岛上首个海洋主题乐园...
原创 分... 分析:国王队高管对勇士队库明加的“强硬评论”如何影响谈判 随着乔纳森·库明加自由球员市场风波的持续发...
银政投携手助力,拱墅区“科创源... 潮新闻客户端 记者 俞萍丽 通讯员 腾珍妮 9月19日,“运河同心 产学融合 城市机遇 幸会杭州——...
国际研讨会聚焦新质生产力如何增... 来源:中国新闻网 中新网北京9月19日电 (记者 刘亮)“现代化进程中的新质生产力”国际研讨会19日...
济南出台一揽子扶持政策:“喂养... 来源:威海播报 在济南超算中心产业园内,山东四维云科数据科技有限公司一群刚参加工作的年轻人正在电脑前...
北京亦庄智慧城管平台上线试运行 原标题: 亦庄智慧城管平台上线试运行 大模型实时精准识别29类“城市病” 记者9月18日从北京经开区...
拒收!今年黄牛最头痛的手机出现... 9月19日,iPhone17系列发售首日,多地门店排起长队。 据报道,新款iPhone屏幕更大且足够...