美国俄勒冈大学研究团队发布了一项突破性成果。他们利用ChatGPT同源技术,攻克了生物进化研究难题,开发出全球首个面向群体遗传学的语言模型。该人工智能(AI)工具可解析DNA序列中的突变规律,几分钟就可追溯基因对的共同祖先。
在传统群体遗传学中,依赖概率统计的推断方法虽精度可靠,但面临计算效率瓶颈。尤其在应对大规模基因组数据时,解析单个染色体可能耗时数日,且难以处理片段缺失的不完整序列。
新模型将繁重的统计运算前置到训练阶段,实际应用时仅需数分钟即可完成传统方法需数小时的任务,速度提升达数十倍。测试表明,其在推算基因“认祖”这一核心指标上,已媲美现有最优统计方法。
研究团队正将其应用于疟疾防控领域,通过分析蚊虫种群中抗药性基因的演化轨迹,揭示杀虫剂选择压力下的进化动态。而理解抗性基因何时出现、如何扩散,正是制定可持续防控策略的关键。模型对非完整数据的兼容性,恰好解决了野外采样常见的基因序列碎片化难题。
团队计划进一步拓展模型功能,从当前双谱系分析向多谱系全基因树重建迈进。尽管传统方法已能实现部分功能,但机器学习路线有望在处理海量数据方面展现独特优势。目前团队正致力于优化算法,以捕捉更复杂的进化信号。