8月7日,国际学术期刊Briefings in Bioinformatics在线发表了中国科学院分子细胞科学卓越创新中心陈洛南研究组的最新研究成果 “Single-cell causal network inferred by cross-mapping entropy” 。该成果提出了新的因果模型,邻居交叉映射熵(neighbor cross-mapping entropy, NME),用于从稳定数据和时间序列数据中推断因果关系和基因调控网络(Gene Regulatory Network, GRN)。
基因调控网络揭示了控制细胞状态的复杂分子相互作用。然而,由于数据噪声和分子非线性,确定基因之间的因果关系具有挑战性。为了解决这些问题,作者提出了一种新的信息论方法,邻居交叉映射熵(NME),用于估计变量之间的因果关系,并对稳态数据和时间序列数据推断有向GRN,克服了基于信息论的GRN方法的局限性(图1A)。NME可以基于函数连续性的思想,通过改变邻居的大小来量化两个变量之间的“连续因果关系”及其因果强度。同时, 作者还将NME扩展到条件邻居交叉映射熵(cNME),以获得变量之间的直接因果关系 (图1B)。与现有方法相比,NME和cNME都表现出更优越的性能。此外,针对scRNA-seq数据集,作者开发了基于NME/cNME的scNME,它可以识别细胞状态,消除物种异质性,并有效推断单个细胞的网络活性(图1C)。
综上所述,NME可以准确、稳健地估计变量的直接因果关系,同时在单细胞数据中可以识别新的细胞类型/状态和预测细胞类型特异性网络模块。
分子细胞卓越中心陈洛南研究员为本文通讯作者,博士后李琳、博士研究生夏瑞和硕士研究生陈薇为论文第一作者。该研究得到了国家自然科学基金委及上海市科委等项目的重要支持。
文章链接:https://academic.oup.com/bib/advance-article/doi/10.1093/bib/bbad281/7237942
NME算法的框架