Nat. Methods | 单细胞蛋白质生物学的上下文AI模型

  • A+
分享一篇Nature Methods上的文章 “Contextual AI models for single-cell protein biology”,本文通讯作者是来自哈佛医学院的Marinka Zitnik教授,研究方向为利用AI进行科学发现,及进行个体化的诊断与治疗等。


1
蛋白质是细胞的基本功能单元,其相互作用实现了不同的生物学功能。机器学习进行预测的方法能高通量地对蛋白质相互作用网络进行预测,增加人们对于蛋白与功能间关系的理解。虽然细胞都有相同的基因,但蛋白的表达却取决于不同类型的细胞和组织,也可因疾病等发生改变。因此生物学情景的引入能提升蛋白的表征效果,而目前的深度学习算法欠缺这一点,单细胞转录组的结果能很好解决这一问题。作者在本文中发展了PINNACLE这一深度学习模型,利用了单细胞转录组及PPI、细胞细胞相互作用等数据,产生了高质量的各种细胞类型的蛋白质表达预测。
2


作者利用了多个器官的单细胞转录组数据,从中找到每种细胞类型相比于平均水平高表达的基因,并从蛋白-蛋白相互作用网络中提取出其对应的蛋白及其最大的连接对象,以此构建出蛋白相互作用网络。得到的相互作用网络虽然与整体的相互作用网络很相似但也保留了高度的细胞类型特异性。后续作者又利用细胞相互作用等数据将这些网络连接形成更大的网络。PINNACLE利用了注意力及图神经网络的机制使信息在蛋白间、细胞类型间、组织间进行流动,通过自监督学习的方式进行连接的学习。


7


测试结果发现,PINNACLE能很好地对不同细胞类型的蛋白质表征进行预测,而无上下文的模型(context-free models)则无法捕捉到不同细胞类型间的差异。利用上述预训练模型,经过后续的微调可以适应不同的下游任务。例如作者对PINNACLE进行微调,训练出了预测可能的治疗靶标的模型,相比于无上下文的模型有更好的表现。


本文作者:JGG
责任编辑:WYQ
原文链接:
https://www.nature.com/articles/s41592-024-02341-3
文章引用:10.1038/s41592-024-02341-3




weinxin
我的微信
关注我了解更多内容

发表评论

目前评论:0