Nature Communications | 何祥火团队与合作者绘制人类癌细胞系的泛癌RNA转录本图谱

发表时间:2022-11-17  |  阅读次数:443次  |  字体大小 [ ]

 细胞内RNA作为指导蛋白质翻译的模板,受到了多种调控和修饰。不同的情况下,基因产生的转录本表达水平会发生改变,乃至产生不同的转录异构体,进而形成多种蛋白质亚型。在RNA转录本水平进行研究,可以更加精准地描绘癌症转录组的改变。然而,目前大部分的研究是在基因水平,而忽视了RNA转录本的多样性,尚未有研究系统性地分析大规模人源癌细胞系的转录本图谱,并揭示其调控及与抗肿瘤药物敏感性的关系。

2022年11月10日,我院何祥火团队联合上海交通大学医学院附属第一人民医院李胜利团队在Nature Communications在线发表了题为Systematic characterization of cancer transcriptome at transcript resolution的最新研究成果,通过对来自Cancer Cell Line Encyclopedia (CCLE)的25个组织的1017个癌细胞系的转录组数据进行转录本有参组装和定量,结合调控组学、肿瘤药物反应与弹性网络回归算法,揭示了泛癌细胞系的RNA转录本图谱及其受RNA结合蛋白(RBP)的调控模式和与药物反应的关联,为进一步肿瘤生物学研究和精准药物开发提供了基础。

图片

 研究人员首先对1017个肿瘤细胞系的RNA-seq数据进行有参组装和定量,生成泛癌细胞系的RNA转录本图谱。其中72.55%的转录本来源于蛋白质编码基因,但约一半是未注释的转录本。此外,来源于非编码区域的转录本有42.70%附近存在顺式作用元件。然后,他们通过t-SNE可视化泛癌转录本图谱,展示了泛癌细胞系的转录组多样性和特异性(图1)。不同组织来源的细胞系能被聚成一类,体现了相同起源的癌细胞具有类似的转录本表达模式。进一步基于香农熵计算转录本的特异性,获取癌细胞系特异性转录本,揭示了不同组织来源的癌细胞系转录本的特异性表达。此外,该研究团队2022年4月份发表的一项工作,通过对33种癌症和29种正常组织共27741个样本进行RNA转录本特异性分析,识别了表征不同癌症类型和组织类型的RNA转录本,为癌症类型特异性诊断提供了有价值的参考资源。

图片

图1. 泛癌RNA转录本图谱及转录本特异性表达

通过有参组装发现的众多新转录本,在癌细胞系中广泛表达,那它们是否具有生物学功能和临床意义呢?作者利用基因集变异分析(GSVA)计算不同细胞系的生物通路活性并与转录本表达进行相关分析。发现新转录本主要和上皮间质转化(EMT)、凝血和TNFA等通路相关。通过TCGA数据库进一步分析发现,新转录本在癌旁和癌组织间或不同阶段的癌组织间存在表达差异,还与肿瘤患者的预后相关。为了证实新转录本的存在和潜在价值,作者挑选了一个新转录本进行实验验证,该转录本相比同一个母基因(AC092803)的已知转录本能够更好地预测患者生存状况并在癌旁和癌组织间存在显著的差异。

在获取了泛癌细胞系的转录组图谱后,作者想进一步研究这些转录本是如何被调控的,于是结合了The Encyclopedia of DNA Elements(ENCODE)数据库的RBP敲减(KD-RNA-seq)和结合(eCLIP-seq)数据,构建了包含129种RBP和47,667条转录本的高度可信的RBP-转录本调控网络,揭示了不同类型RBP对转录本的调控作用以及其可能调控的生物学通路。

随后,作者获取了Cancer Therapeutics Response Portal(CTRP)数据库中的药物敏感性数据,采用弹性网络回归算法和自助抽样法分析转录本的表达和药物敏感性的潜在关系。结果发现大部分抗肿瘤药物的不敏感与转录本表达的关系多为正相关。不同类型的抗肿瘤药物相关的转录本在不同的生物学通路均有富集,而靶向Notch通路药物相关的转录本则仅仅富集到3个通路(EMT、Apical junction和UV response down)。此外,只有靶向IGF1R通路药物相关的转录本能够富集在免疫相关通路(inflammatory response和IL6 JAK STAT3 signalling)。

为了进一步揭示RBP通过调控转录本影响药物反应的机制,作者构建了RBP-转录本-药物反应调控网络,涉及128个RBP、 430个抗肿瘤药物和15,511条转录本,共包含1,066,380个调控关系对。为了验证调控通路的可靠性,作者挑选了PTBP1-ENST00000373481.7(KIAA1522)-decitabine通路进行了实验验证,证实了RBP通过转录本来调节药物敏感性。

最后,作者构建了The Transcript Atlas in Cancer(TAiC)数据库(图2),包括转录本表达数据、转录本编码能力、RBP调控模式、药物反应以及临床关联,为在转录本水平上研究癌症提供有价值的资源。


图片

图2.TAiC数据库内容示意图

 综上,该研究系统性分析了大规模泛癌细胞系的转录本图谱及其RBP调控模式,对在转录本水平上深入理解癌症的发生和发展具有重要意义,进一步分析与药物敏感性的关联,有利于深入理解和预测肿瘤耐药。

原文链接:https://www.nature.com/articles/s41467-022-34568-z


Top