科研进展

吴立刚组建立小RNA绝对定量深度测序方法并构建跨组织精准定量数据库

来源: 时间:2026-02-28

2月3日,国际学术期刊Nature Communications在线发表了中国科学院分子细胞科学卓越创新中心(生物化学与细胞生物学研究所)吴立刚研究组的最新研究成果,题为 “An absolute quantification atlas of small non-coding RNAs across diverse mammalian tissues and cell lines”。该研究开发了深度测序新方法4NBoost,实现了对microRNA(miRNA)和PIWI相互作用RNA(piRNA)等非编码小RNA(简称小RNA,sncRNA)的高精度绝对定量,在此基础上,团队构建了覆盖多种哺乳动物组织、拟南芥组织以及常用细胞系的小RNA定量图谱,并进一步搭建了数据库SmRNAQuant (http://wulg-lab.sibcb.ac.cn/SmRNAQuant/),为科研人员提供便捷、可靠的小RNA高精度表达图谱查询服务,支持公开使用与深入挖掘。

大量研究表明miRNA、piRNA和小干扰RNA(siRNA)等小RNA在生殖、发育、表观遗传及肿瘤发生等生命过程中发挥了极为重要的调控作用。小RNA的调控活性与其细胞内表达浓度密切相关,高丰度的小RNA通常能够更有效地抑制靶基因表达;另外,双链小RNA前体的链选择性对于小RNA发挥功能也至关重要。因此,绝对定量对于解析小RNA的功能具有重要意义,而小RNA的定量偏差不仅极大地影响基础研究的准确性,也阻碍了疾病标志物的发现和精准治疗的发展。

近年来快速发展的二代测序技术有力推动了小RNA研究的深入和拓展,但目前主流测序文库构建依赖于 T4 RNA 连接酶进行接头连接,该酶因其固有的RNA结构依赖性,会引入显著定量偏差,导致部分小RNA表达水平被系统性高估或低估,从而影响功能解析。为减少这一偏差,研究者已开发出多种改进策略,例如引入随机接头或提高 PEG浓度,代表性方法包括4N-seq、AQ-seq、IsoSeek和NEXTflex。然而,这些方法主要针对3′端为2′-羟基(2′-OH)的小RNA优化,对普遍携带2′-O-甲基修饰(2′-Ome)的piRNA及植物miRNA效果较差,且多数方法未引入分子标签(UMI)以校正PCR扩增偏好,难以实现小RNA的绝对定量。此外,现有小RNA数据库(如miRBase、MirGeneDB、miRmine和DIANA-miTED)均基于存在系统偏差的测序数据构建,缺乏定量准确的小RNA参考数据库。

针对上述挑战,研究团队开发了4NBoost测序技术,通过引入随机接头并优化建库体系,最大限度降低连接偏差,同时利用已知浓度的外源RNA spike-in建立标准曲线,实现文库中小RNA分子的精准绝对定量。利用该技术,研究团队系统分析了20种小鼠组织、18种食蟹猴组织、24种常用细胞系以及4种拟南芥组织中的小RNA表达图谱,构建了目前涵盖范围最广泛的哺乳动物小RNA绝对定量参考图谱数据库。与现有小RNA数据相比,该图谱在小RNA丰度评估、链选择性分析及组织特异性表达解析等方面均表现出更高准确性。

传统小RNA测序数据规模庞大,蕴含过去二十多年对不同物种、组织、细胞和疾病研究中积累的大量小RNA表达图谱信息,是极为珍贵的巨大资源库,如何利用上述资源更好地服务基础研究和转化医学领域的小RNA研究是一项重大挑战。因此,研究团队引入机器学习方法,对既有数据中存在的系统偏差进行建模与校正,从而实现直接将传统测序数据转化为定量更为准确的表达图谱。这一策略有效提升了历史数据的利用价值,避免了重复测序带来的资源消耗。进一步,基于4NBoost产生的无偏定量数据,团队构建了SmRNAQuant数据库,并整合偏差校正模型,为科研人员提供便捷的小RNA高精度表达图谱查询与分析平台。

综上,该研究通过建立4NBoost技术、偏差校正模型及SmRNAQuant数据库,共同构建了一个功能完整的一体化研究体系,为推动小RNA基础机制研究及临床转化应用提供了重要的工具与平台,同时也标志着小RNA研究从“相对表达时代”迈入“绝对定量时代”。

分子细胞卓越中心博士后肖稳、博士研究生郑玉丽、副研究员张宏道和高级实验员徐蓓英为该论文的共同第一作者。分子细胞卓越中心吴立刚研究员和张宏道副研究员为该论文的共同通讯作者。该研究获分子细胞卓越中心动物实验技术平台、生物信息学平台和高性能计算存储与网络服务中心大力支持,同时获国家自然科学基金委、科技部、中国科学院和上海市经费支持。

文章链接:https://www.nature.com/articles/s41467-026-68812-7

4NBoost方法(左)实现偏差最小化、高精度绝对定量的小RNA测序。基于该技术,绘制涵盖20种小鼠组织、18种食蟹猴组织、24种常用细胞系及4种拟南芥组织的小RNA绝对定量图谱(中)。以上数据整合为SmRNAQuant在线数据库(右),为科研人员提供便捷、可靠的小RNA绝对表达查询、比较与分析平台

附件下载: