共计 1752 个字符,预计需要花费 5 分钟才能阅读完成。
随着全球癌症病例的持续增加,疾病的复杂性也在不断上升,这为诊断和治疗的科学进展带来了新的挑战。在这一背景下,人工智能(AI)技术逐渐成为预测和检测癌症的宝贵工具。
巴西和波兰的研究人员最近开发了一种基于机器学习的模型,该模型能够通过识别特定蛋白质来预测某些类型肿瘤的侵袭性。这项研究发表在《Cell Genomics》期刊上,为癌症治疗提供了新的视角。
该机器学习模型生成一个从零到一的干性指数,其中零表示低侵袭性,一表示高侵袭性。随着指数的增加,癌症往往变得更加侵袭性、耐药性更强,并且更有可能复发。干性程度反映了肿瘤细胞与多能干细胞之间的相似程度,后者可以转化为人体中几乎任何类型的细胞。随着疾病的发展,恶性细胞变得越来越不像它们起源的组织,表现出未分化的表型。
研究人员使用了来自临床蛋白质组肿瘤分析联盟(CPTAC)的 11 种癌症数据集来开发这一工具,并基于蛋白质表达开发了干性指数(PROTsi)。他们分析了超过 1300 个乳腺癌、卵巢癌、肺癌、肾癌、子宫癌、脑癌、头颈癌、结肠癌和胰腺癌样本。
通过将 PROTsi 与 207 个多能干细胞的蛋白质组数据整合,研究小组确定了驱动某些类型肿瘤侵袭性的蛋白质。这些分子可能是新的通用或特定疗法的潜在靶点。因此,该工具不仅有助于推进治疗的临床开发,还有助于癌症治疗的个性化。
巴西圣保罗大学里贝朗普雷图医学院的教授 Tathiane Malta 表示:“许多这些蛋白质已经是市场上为癌症患者和其他疾病提供的药物的靶点。它们可以在未来的研究中基于这一识别进行测试。”
Malta 是该文章的通讯作者,与波兰波兹南医科大学的 Maciej Wiznerowicz 教授一起。Wiznerowicz 教授是 2022 年旨在促进和认可女性参与科学的奖项的获奖者之一,以表彰她多年来的工作。
2018 年,Malta 作为第一作者发表在《Cell》上的一篇文章中,她的团队开发了一个干性指数,可以客观地测量肿瘤样本与多能干细胞之间的相似性。她表示:“当时,我们使用美国癌症基因组图谱维护的公共肿瘤数据库开发了基于机器学习的算法。现在,我们正在使用基于蛋白质组学的 CPTAC 数据库,并更新了我们的工作,分析了蛋白质,这是一种可以应用于治疗可能性和临床应用的功能分子。”
基于迄今为止获得的结果,PROTsi 与之前发表的转录组得出的干性评分呈正相关。例如,PROTsi 在区分肿瘤和非肿瘤样本方面更为有效。
Malta 的导师 Renan Santos Simões 表示:“科学进展缓慢、谨慎,并且由许多人共同构建。令人欣慰的是,我们正在为这一过程做出贡献。这就是激励我们的原因:知道我们今天所做的可以对患者产生真正的影响,改善治疗和生活质量。”
在 2 月 4 日的世界癌症日,世界卫生组织(WHO)警告说,全球每分钟有 40 人被诊断出患有癌症并需要治疗。肿瘤是导致死亡的主要原因之一,并且对年轻人口的影响最大。2023 年发表在《BMJ Oncology》上的一项研究显示,1990 年至 2019 年间,50 岁以下成年人的早发癌症发病率增加了 79%,癌症相关死亡人数增加了 28%。
巴西国家癌症研究所(INCA)估计,2023 年至 2025 年期间,每年将有 704,000 例新癌症病例。根据 2023 年巴西癌症发病率估计,最常见的恶性肿瘤是非黑色素瘤皮肤癌,其次是女性乳腺癌、前列腺癌、结肠和直肠癌、肺癌和胃癌。
在验证过程中,PROTsi 在多个数据集中表现出一致的性能。它清楚地区分了干细胞和分化细胞,不同的肿瘤处于各种中间水平。例如,PROTsi 在子宫癌和头颈癌病例中展示了预测能力。此外,该工具在区分腺癌、子宫癌、胰腺癌和儿童脑癌样本中的高级别肿瘤方面更为有效。
Malta 表示:“我们试图构建一个可以应用于任何癌症的模型,但我们发现它对某些癌症的效果比对其他癌症更好。我们正在为未来的工作提供数据源。”据她介绍,USP 小组正在测试其他计算模型,以提高预测能力。
更多信息:Iga Kołodziejczak-Guglas 等,基于蛋白质组学的干性评分测量致癌去分化并实现可药物靶点的识别,《Cell Genomics》(2025)。DOI: 10.1016/j.xgen.2025.100851
期刊信息:Cell Genomics,Cell
由 FAPESP 提供