彭利红教授课题组《Computers in Biology and Medicine》:基于梯度提升神经网络和可解释的boosting机器识别潜在配体-受体相互作用并应用于细胞间通讯分析
多细胞生物体的复杂结构和功能是通过不同细胞之间的协调活动来实现的,这些协调活动的主要形式是细胞间通讯(CCC)。CCC对许多生物过程至关重要,包括细胞命运决定、增殖、迁移和内稳态。越来越多的 CCC 研究描述了细胞在其局部社区中的作用以及它们如何执行其功能,这在生物医学和生物治疗中具有巨大的应用潜力。
该论文介绍了CellGiQ,一个用于识别配体-受体相互作用的细胞间通讯预测框架。
作者介绍了一个用于细胞间通讯分析的高置信度LRI预测框架CellGiQ。CellGiQ首先通过 BioTriangle的 LRI特征提取推断出高度可靠的 LRI,利用 LightGBM进行LRI选择,并集成梯度增强神经网络和可解释增强机进行LRI分类。随后,通过结合单细胞RNA测序(scRNA-seq)数据,过滤已知和识别的高置信LRI,并通过四分位评分策略进一步应用于细胞间通讯推断。为评估模型预测结果,CellGiQ 进行了一系列实验:使用AUC和 AUPR,它在四个 LRI 数据集上超过了6个代表性的 LRI 预测模型;基于维恩图和分子对接,通过与五种常用的细胞间通讯推断方法进行比较,验证了其预测的LRIs;基于重叠的LRI,利用六种最先进的细胞间通讯预测工具,计算了人类HNSCC组织内的高Jaccard指数;通过与经典模型和文献检索比较,进一步验证了其推断的HNSCC相关细胞间通讯结果。本研究的新颖之处在于基于机器学习识别高置信度的LRI,并设计了几种LRI验证方法,为计算LRI预测提供参考。CellGiQ 提供了一个开源和有用的工具,以单细胞分辨率分解 LRI介导的细胞间通讯。
湖南工业大学生命科学与化学学院彭利红、湖南工业大学生命科学与化学学院高鹏飞为本论文共同第一作者;江南大学理学院陈兴、湖南工学院计算机科学与工程学院李泽军为论文的共同通讯作者;该工作得到了国家自然科学基金委、湖南省自然科学基金项目等方面的资助。
原文链接:https://www.sciencedirect.com/science/article/abs/pii/S001048252400194X