AI突破:CellTransformer绘制1300区小鼠大脑图谱

3次阅读
没有评论

共计 2948 个字符,预计需要花费 8 分钟才能阅读完成。

在人工智能与神经科学的交汇领域,加州大学旧金山分校(UCSF)与艾伦研究所的科研团队取得了突破性进展。他们成功绘制了迄今为止最为详尽的小鼠大脑图谱,涵盖了 1300 个区域及子区域。这一成果的核心在于 CellTransformer,一种先进的人工智能模型,它能够从海量的空间转录组数据中自动识别大脑的关键子区域。这一新图谱不仅包含了以往未被绘制的大脑区域,更为神经科学的探索开辟了新的道路。

这一发现提供了前所未有的细节,使得研究人员能够将特定功能和行为与更精确的细胞区域联系起来,从而深化对大脑的理解。这为新假设和研究的提出提供了清晰的路线图,以探索这些区域在大脑中的作用。

AI 突破:CellTransformer 绘制 1300 区小鼠大脑图谱

UCSF 的神经学和生物工程学副教授 Reza Abbasi-Asl 博士解释道:“我们的模型基于与 ChatGPT 等 AI 工具相同的强大技术,两者都建立在‘transformer’框架上,该框架擅长理解上下文。虽然 transformer 通常用于分析句子中单词之间的关系,但我们使用 CellTransformer 来分析空间中相邻细胞之间的关系。它通过学习预测细胞的分子特征,从而构建出组织的详细图谱。”

Abbasi-Asl 博士是发表在《自然通讯》上的论文的资深和通讯作者,论文题为“基于 transformer 的小鼠大脑数据驱动细粒度区域发现”。研究团队在论文中指出:“CellTransformer 通过促进识别可扩展到非常大、多动物空间转录组数据集的粒度和生物学相关空间域,推动了自动化领域检测的最新技术。”

空间转录组学为研究人员提供了“定义组织和器官(如小鼠大脑)空间组织的独特机会”。虽然空间转录组学揭示了某些脑细胞类型在大脑中的位置,但它并未基于细胞组成揭示大脑区域。

CellTransformer 使科学家能够基于共享细胞邻域的计算定义大脑区域和细分,就像根据城市内的建筑类型绘制城市边界一样。“我们的目标是开发一种工具,以数据驱动的方式操作性地识别合理的大脑结构和子结构,并满足离散领域的神经解剖学惯例,”研究团队在论文中指出。

该方法论的核心是一个基于 transformer 编码器 - 解码器架构的新型深度学习模型,Abbasi-Asl 解释道。“该模型通过自监督过程学习组织的丰富表示。它本质上学习基于周围细胞邻域的上下文预测细胞的分子特征。”

这使得模型能够从单细胞和分子水平的局部模式到大规模组织域层次化地理解组织结构,Abbasi-Asl 评论道。该模型能够从高维数据中提取描述性信息,这些信息对人类来说通常难以解释。提取的信息随后与 GPU 加速的聚类算法配对,将细胞分组到整个数百万细胞数据集中的不同区域。

该模型的核心架构与 ChatGPT 类似,Abbasi-Asl 进一步解释道。“两者都建立在‘transformer’框架上,该框架擅长理解上下文。虽然 ChatGPT 学习句子中单词之间的关系,但 CellTransformer 通过分析中心细胞与其邻居之间的关系来学习细胞的‘语言’。”两者都使用自监督方法,这意味着它们直接从数据本身学习这些复杂模式,而不需要手动标记每个细胞。这使得它们能够揭示数据中的重要关系,无论是文本还是生物组织。

艾伦研究所的通用坐标框架(CCF)是验证 CellTransformer 准确性的重要金标准。“我们将此方法与艾伦脑细胞 - 小鼠全脑图谱结合使用,这是迄今为止最大的空间转录组数据集之一,以解锁对哺乳动物大脑解剖结构的新见解,”Abbasi-Asl 补充道。结果证实,该模型成功复制了已知的大脑区域,如海马体,但更重要的是,它还能够发现此前未编目的更细粒度的子区域。

“典型的大脑神经解剖学研究是专家驱动的多模态数据探索,但我们展示了我们的技术与艾伦研究所合作生成的惊人数据结合,可以一次性发现这些子区域。重要的是,我们的方法揭示了此前已知的解剖结构以及在大脑注释不良区域中的新细粒度区域。”

作者进一步指出:“CellTransformer 在整合组织切片中的细胞方面非常有效,识别与现有本体(如艾伦小鼠大脑通用坐标框架)高度相似的域,同时允许发现数百个未编目区域,且域空间一致性损失最小。”

这些发现之所以值得注意,主要是因为它们解决了现代神经科学中的一个主要瓶颈,即可扩展性,Abbasi-Asl 指出。“现有方法通常无法处理由器官规模空间转录组生成的极大体积数据,这些数据可能涉及数百万或数千万个细胞。CellTransformer 是能够处理这种规模的少数工作流程之一。这一发现的一致性也值得注意;由于自然变异,从多个个体动物创建一致图谱是一个重大挑战,而该模型的能力代表了迈向真正代表性参考图谱的重要一步。最后,无偏见、数据驱动的新颖和合理大脑子区域的发现使该领域超越了传统的手绘地图。”

拥有 1300 个区域和子区域,该图谱代表了迄今为止任何动物中最细粒度和最复杂的数据驱动大脑图谱之一。“这就像从仅显示大陆和国家的地图转向显示州和城市的地图,”研究合著者、艾伦研究所分子遗传学主任 Bosiljka Tasic 博士说。“这种新的、详细的大脑分区完全基于数据,而不是人类专家注释,揭示了小鼠大脑中此前未绘制的子区域。基于数十年的神经科学,新区域对应于待发现的专门大脑功能。”

第一作者、UCSF 博士候选人 Alex Lee 评论道:“通过将 CellTransformer 自动识别的大脑区域与 CCF 进行比较,我们能够展示我们的数据驱动方法识别与已知专家定义的解剖结构一致的区域。看到我们的模型产生与 CCF 如此相似的结果,这是该领域非常特征化和高质量的资源,令人放心。与 CCF 的高度一致提供了一个关键基准,使我们相信 CellTransformer 发现的新子区域可能也具有生物学意义。我们希望通过进一步的计算和实验研究探索和验证这些结果。”

Abbasi-Asl 认为,这项工作将通过提供更详细和准确的哺乳动物大脑图谱来推进生物科学,这对理解其功能至关重要。“更高分辨率的图谱使科学家能够将特定功能、行为或疾病状态与更小、更精确的细胞域联系起来。我们的工作通过提供完全数据驱动的大脑图谱,推动了神经解剖学领域的发展,该图谱不需要多年的人类驱动手动注释,并且较少受到历史数据收集技术的偏见。”

这项研究的潜力超出了神经科学。CellTransformer 的强大 AI 能力是组织无关的:它们可以用于其他器官系统和组织,包括癌症组织,其中大规模空间转录组数据可用于更好地理解健康和疾病的生物学,并推动新治疗方法的发现。

“…可扩展的计算工作流程本身是一个重大进步,可以应用于其他器官和物种,为广泛的生物系统创建类似的详细图谱,”Abbasi-Asl 表示。“虽然这项研究专注于小鼠大脑,但该计算方法是一个强大的、组织无关的工具,可以应用于任何器官系统,如心脏,其中大规模空间转录组数据可用。这项工作提供了一个新的大脑图谱,以及为几乎任何组织创建高分辨率细胞图谱的基础和可扩展解决方案。这为跨物种和疾病状态的更深层次、数据驱动的组织理解铺平了道路。”

作者总结道:“随着大脑的空间解析转录组和多组学研究变得越来越普遍,CellTransformer 等工具提供了将数据转化为大脑和其他复杂器官的精细解剖图谱的途径,并为组织级结构 - 功能映射铺平了道路。”

正文完
 0
admin-gah
版权声明:本文于2025-10-08转载自Genetic Engineering and Biotechnology News,共计2948字。
转载提示:此文章非本站原创文章,若需转载请联系原作者获得转载授权。
评论(没有评论)
验证码