Trends in Genetics | 杨力课题组综述环形RNA识别和定量的策略与挑战
2011年左右,随着对不含多聚腺苷酸尾(poly(A) tail)转录本的深入研究,越来越多的环形RNA在细胞内被发现,其生成加工机制和潜在功能也在近十年被广泛研究。已知大部分的真核环形RNA由外显子反向剪接生成,即下游5'剪接位点反向连接到上游3'剪接位点形成共价闭合环结构。环形RNA的生成受到顺式作用元件和反式作用因子等多种因素调控,且一些高表达的环形RNA可参与多种生物功能调控。因为环形RNA与共表达的同源线性RNA序列相同,所以在全转录组范围内精确注释和精准定量环形RNA存在困难。深入理解不同纯化、富集、测序、识别和定量等方法的利弊,对环形RNA生成机制和功能作用研究的开展至关重要。
2023年10月13日,复旦大学生物医学研究院马旭凯青年研究员与杨力研究员研究团队在Cell Press旗下期刊Trends in Genetics发表了题为“Approaches and challenges in genome-wide circular RNA identification and quantification”的综述,系统总结了全基因组环形RNA富集与测序、计算识别与定量的不同策略。
多种不同的转录组RNA纯化策略和测序方法已被用于环形RNA研究(图1)。其中,poly(A)+ RNA-seq最初设计用于分析大多数含poly(A)尾的mRNA和lncRNA,并不适合环形RNA分析。poly(A)–和ribo– RNA-seq是两种广泛用于环形RNA检测的测序方法,均可以检测到约十倍于poly(A)+ RNA-seq中的反向剪接位点(back-splicing junction,BSJ)测序片段数量,RNase R的处理则可以再提高三至十倍的BSJ测序片段数量。而长读长测序方法则在全长环形RNA分析和鉴定方面具有明显优势。解析高通量测序数据进行全基因组环形RNA识别主要依赖于鉴定其区别于线性RNA的BSJ,随后识别比对到BSJ的测序片段。根据如何识别比对到BSJ的测序片段,环形RNA鉴定计算流程可以分为两类:利用比对软件将测序片段比对到基因组上,再识别比对到BSJ的融合测序片段的融合测序片段识别法(fusion-read-based)或先根据现有的基因注释信息构建包含BSJ的假参考基因组,然后将测序片段比对到假参考基因组以识别环形RNA的假基因组法(pseudo-reference-based)。除了环形RNA的鉴定,其精准定量也是对环形RNA功能研究的重要基础。根据鉴定环形RNA的基本原理,可以使用比对到BSJ的测序片段来定量环形RNA表达水平,然而使用绝对的测序片段值进行环形RNA表达水平的样本间比较可能存在偏差。因此建议使用归一化后得到的FPB或FPM等值表征环形RNA表达水平。不同的纯化和富集策略也会影响环形RNA的定量,例如是否进行RNase R处理。最后,因为一个基因位点可能同时产生环形RNA和同源线性RNA,在评估环形RNA表达水平时应考虑线性RNA表达。解决方案之一是找到具有低表达水平线性RNA背景的高表达环形RNA。已有多种策略在不同的计算分析流程中被提出,例如通过CIRCexplorer3/CLEAR计算得到CIRCscore,来表征相对于线性RNA的环形RNA表达水平。不断发展的转录组富集策略、测序技术和计算方法将推动环形RNA生成调控和功能作用研究,也将为利用环形RNA开展诊断和治疗等潜在应用研究提供基础和支持。
图1 用于全转录组环形RNA识别的测序方法
复旦大学生物医学研究院/复旦大学附属儿科医院马旭凯青年研究员和杨力研究员为该论文的(共同)通讯作者。该工作获得基金委、科技部、中科院和上海市科委等项目的资助。
原文链接:https://www.cell.com/trends/genetics/fulltext/S0168-9525(23)00223-8