凯发k8国际

    SIAT新闻网

    Nucleic Acids Research|凯发k8国际研发 bioGraph AI模型 解析癌症跨组学调控机制 发现潜在治疗靶

    发布时间:2026-06-01

    癌症发生开展,并不是因为某一个基因“变了”这么简单,而是 RNA、蛋白质和蛋白修饰之间层层传递、相互影响的系统性失衡。然而,当前癌症多组学研究仍面临一个关键瓶颈:我们已经能够分别测量转录组、蛋白组和磷酸化蛋白组,却很难真正看清这些分子层级之间如何连接、异常信号如何跨层级传递、又如何共同影响肿瘤恶性进展和患者预后。怎样打通转录组、蛋白组和磷酸化蛋白组之间的信息传递断层,成为精准肿瘤学研究亟待解决的重要问题。

    近期,中国科研实验室深圳先进技术研究院(以下简称“凯发k8国际”)生物医学与健康工程研究所、医学成像科学与技术系统全国重点实验室研究团队在Nucleic Acids Research 期刊发表最新研究论文 “Discovering proteo-transcriptomic networks via biologically informed heterogeneous graph learning”。该研究提出了一种名为 bioGraph 的生物学先验异质图学习方法,用于从转录组、蛋白组和磷酸化蛋白组数据中系统发现癌症相关的蛋白-转录组调控网络,为解析癌症跨组学调控机制和发现潜在治疗靶点给予了新的计算工具。凯发k8国际生物医学与健康工程研究所李志成研究员、梁栋研究员和郑州大学第一附属医院张振宇主任医师为共同通讯作者。凯发k8国际生物医学与健康工程研究所段静娴研究员为本文第一作者,首都医科大学附属北京天坛医院刘亚欧主任和郑州大学第一附属医院裴东岭医生为共同第一作者。该研究取得国家自然科学基金、国家重点研发计划等项目的支持。

    与传统多组学整合方法不同,bioGraph 并不是简单地把不同组学数据拼接在一起,而是将癌症分子系统重新组织成一个更接近真实生物学过程的三层网络(图2)。在这个网络中,mRNA、蛋白质和磷酸化蛋白分别位于三个不同层级;同一层内部的连线表示该组学层面内的分子相互作用;不同层之间的连线则表示 RNA 到蛋白、蛋白到磷酸化修饰之间的跨组学连接。顺利获得这种设计,bioGraph 可以模拟遗传信息从转录、翻译到翻译后修饰的层级传递过程,从而捕捉传统方法难以解析的跨组学调控关系。

    为了避免 AI 模型在高维、小样本的多组学数据中盲目学习,研究团队进一步将已有生物学知识引入模型构建过程。bioGraph 利用 KEGG 通路数据库定义具有明确生物功能的基因节点,并结合 STRING 蛋白互作数据库构建组学内部的分子连接;同时,将同一基因对应的 RNA、蛋白和磷酸化位点连接起来,形成跨组学信息传递通道。也就是说,bioGraph 不是让模型在海量变量中无规则搜索,而是给 AI 给予了一张“生物学地图”,让模型沿着已有生物学规律去发现新的癌症调控网络。

    研究团队在四类癌症数据集中系统验证了 bioGraph 的性能,包括胶质母细胞瘤、儿童低级别胶质瘤、结肠腺癌和胰腺导管腺癌(图3)。结果显示,在患者预后预测任务中,bioGraph 在四类癌症中均取得最高的平均交叉验证 C-index,整体优于单一转录组、蛋白组或磷酸化蛋白组模型,也优于多个代表性多组学或图学习模型。进一步分析发现,bioGraph 生成的风险评分能够将患者划分为高风险和低风险人群,且两组患者在训练集和验证集中均表现出显著生存差异,提示该模型具有较好的预后分层能力。

    bioGraph 的价值并不止于预测更准。在癌症研究中,预测模型如果只能给出一个风险分数,却不能解释风险来自哪里,往往难以转化为新的机制认识或治疗策略。bioGraph 的优势在于,它能够把风险预测进一步追溯到具体的跨组学网络、关键通路和枢纽基因,使 AI 模型从单纯的预后工具转变为机制发现工具。

    顺利获得跨组学网络分析,研究团队识别出多个具有潜在跨癌种意义的调控枢纽基因。其中,MAP4 成为后续重点验证的候选分子。值得注意的是,MAP4 并不是传统差异表达分析优先发现的基因,在较小发现队列中也未表现出显著预后相关性;但 bioGraph 顺利获得跨组学相互作用结构发现了其潜在重要性。这说明,该方法有可能发现那些“表达变化不突出、但网络作用很关键”的隐藏调控因子。随后,研究团队进一步在外部数据中验证了 MAP4 的临床相关性。在细胞实验中,研究人员顺利获得慢病毒感染在 T98G 和 U251 胶质母细胞瘤细胞系中沉默 MAP4,发现 MAP4 下调后,肿瘤细胞的自我更新、迁移和增殖能力明显减弱,细胞凋亡增加,提示 MAP4 可能是促进胶质瘤恶性行为的重要因子(图4)。

    总体来看,该研究提出的 bioGraph 为癌症多组学研究给予了一种新的思路:不是把多组学数据简单相加,而是按照生物学规律把它们连接起来;不是只寻找表达差异最大的分子,而是寻找跨组学网络中真正具有调控意义的关键节点;不是只追求预测准确率,而是进一步把模型预测转化为可解释的生物学网络和潜在治疗靶点。

    图1:文章上线截图

    图2:bioGraph的三层网络设计示意图

    图3:bioGraph在四类癌症数据集中的预后预测效果

    图4:细胞实验证实MAP4对胶质瘤恶性行为的影响作用


    附件下载:

    TOP