共计 1311 个字符,预计需要花费 4 分钟才能阅读完成。
在最新一期《Trends in Genetics》期刊上,佛蒙特大学和都柏林三一学院的研究团队发表了一项开创性研究,将人工智能(AI)模型与基因编码进行类比,为理解基因如何编码复杂信息以构建生物体提供了新的视角。
这项研究由佛蒙特大学计算机科学和复杂系统科学教授 Nick Cheney 与三一学院遗传学和神经科学教授 Kevin Mitchell 共同完成。他们通过比较当前生成式 AI 模型与基因组的功能,揭示了生物体 DNA 中编码的巨大多样性。
生成式 AI 模型通过分析大量先例,提炼出最本质的特征,并以新的方式重新组合这些属性来生成新的图像和文本。论文提出,基因组同样代表了生物体的关键特征,这些特征在漫长的进化过程中被提炼并存储在 DNA 中。
“为什么猫会生小猫,而狗会生小狗?这个简单的问题触及了生命的一个核心现象——相似产生相似,”发育神经生物学副教授 Mitchell 教授解释道。
“生物体的形态特征,如耳朵的形状、腿的长度,甚至行为倾向,如将物体从桌子上推下或对邮递员吠叫,怎么可能被‘编码’在像 DNA 这样的分子中?”
为了解释这一现象,研究者们提出了多种比喻,从蓝图到程序再到食谱,但这些比喻往往不够准确,有时甚至具有误导性。在这篇新论文中,Mitchell 和 Cheney——一位遗传学家和一位计算机科学家——通过机器学习系统的类比,提出了一种新的思维方式,探讨物种的 DNA 如何编码其物理形态和性质的信息。
随着在线生成式 AI 工具的普及,即使是普通用户也熟悉这些系统如何生成图像——例如猫或狗。这些系统通过对数十万张标记图像的训练,学习到猫和狗的普遍、抽象特征。更具体地说,它们的神经网络编码了一个生成模型——这些特征的高度压缩表示,可以被解码以生成新的图像。
在论文中,Mitchell 和 Cheney 提出——通过类比——基因组编码了生物体的生成模型——一种体现在 DNA 化学序列中的压缩表示。
在这个框架中,进化充当了“编码器”——一种学习并不断调整遗传网络权重的算法,塑造生成模型的变量。发育过程则充当“解码器”——通过胚胎发生的阶段解压缩模型,生成具有该物种典型形态和性质的新个体。
通过在 AI 和生物学的交叉领域工作,Cheney 认为他们的研究和由此产生的类比为古老的生物学问题提供了新的视角,即植物、动物和人类等生物体的巨大多样性如何存储在单个细胞中。
“我们将基因组比作生成模型,这为研究生物学中的开放问题提供了一个平台,这些平台在更易处理的计算模型中更容易进行实验和分析,”Cheney 教授说道。
该理论提出了一个数学框架,帮助理解实验者现在可以收集的关于胚胎发育过程中基因表达模式的大量数据。
由此产生的模型对我们理解遗传变异如何影响性状以及物种如何随时间进化具有深远的意义。它们提供了在人工系统中实施这些相同原则的手段,其中人工生命甚至人工智能可以在与生物体相同的动态下进化。
更多信息: Kevin J. Mitchell 等人,《基因组代码:基因组实例化生物体的生成模型》,_Trends in Genetics_(2025 年)。DOI: 10.1016/j.tig.2025.01.008
期刊信息: Trends in Genetics
由 都柏林三一学院 提供