Nature Communications丨曹纬倩团队与合作者开发完整糖肽水平糖蛋白质组定量工具pGlycoQuant

发表时间:2022-12-09  |  阅读次数:1976次  |  字体大小 [ ]

 蛋白质位点特异性糖基化的定量分析对于生理病理机制探索,疾病诊断和预后标志物的筛选以及抗体药物的开发尤为重要。随着基于质谱(MS)的分析方法和解析软件的发展,蛋白质组范围内大规模完整糖肽的鉴定取得了长足进步。但与之相配套的完整糖肽定量仍存在许多问题:由于糖肽的微观不均一性,糖肽信号比裸肽信号更难识别,完整糖肽定量的准确度和缺失值数都会受到影响;基于数据依赖采集(DDA)策略的糖蛋白组学定量水平受限于MS2鉴定水平,无法定量到鉴定范围以外的糖肽。

2022年12月7日,复旦大学生物医学研究院曹纬倩团队与北京航空航天大学医学科学与工程学院刘超团队在Nature Communications在线发表了题为“pGlycoQuant with a deep residual network for quantitative glycoproteomics at intact glycopeptide level”的研究论文。文章详细介绍了一种大规模、高精准、全局定量糖蛋白组学的工具pGlycoQuant。该工具运用深度残差网络学习模型优化了糖肽匹配的准确性,降低了定量缺失值比率,实现了完整糖肽水平的大规模精准定量。

 当前常用的糖蛋白质组定量工具往往只兼容单一鉴定搜索引擎,且支持定量策略有限。而pGlycoQuant支持基于一级、二级质谱定量的多种策略,包括非标记、化学标记和代谢标记定量,并与多个广泛使用的搜索引擎兼容,目前包括Byonic、MSFragger-Glyco、Open-pFind和pGlyco系列。研究者将ResNet深度学习应用于糖肽证据匹配模型,提高糖肽匹配精度。同时,通过1%定量错误率(FQR)控制Match Between Run (MBR)分析的准确性。此外,研究者开发了Match In Run (MIR)功能,可定量到鉴定范围以外的唾液酸化完整糖肽。

图1.pGlycoQuant定量流程。图片来源 Nat. Commun.

 为进一步评判pGlycoQuant的定量性能,研究人员将pGlycoQuant与配备糖肽定量功能的搜索引擎Byonic-Byologic和MSFragger-Glyco,以及蛋白质组定量软件Skyline和 Proteome Discoverer进行比较,并在三个基准数据集(包括无标记HeLa细胞数据、SILAC标记的293T细胞数据和TMT标记的293T细胞数据)上进行完整糖肽定量。通过比较缺失值比例、定量重复相关性以及分析混合样本(人血清和酵母)倍数变化,证明了相较于其他软件,pGlycoQuant不管在减少缺失值还是定量精准性方面都有更好的表现。

图2.pGlycoQuant对完整糖肽非标定量性能评估。图片来源 Nat. Commun.

 此外,pGlycoQuant被进一步应用于三种不同转移潜能HCC细胞系(无转移潜能的Hep3B细胞、低转移潜能的MHCC97L细胞、高转移潜能的MHCCLM3细胞)的N-糖蛋白组学研究。经过严格的质控,研究者共定量到6,435种完整N-糖肽。通过蛋白质组和完整糖肽水平的糖蛋白质组定量差异分析,研究者筛选到转移相关核心岩藻糖基化蛋白L1CAM。其N979位点的核心岩藻糖基化在三个细胞系中随着转移潜力增加而上调。结合体外分子生物学实验,研究者发现L1CAM N979位点核心岩藻糖基化的增加减少了纤溶酶对L1CAM蛋白的切割,促进了HCC细胞系侵袭和转移,证明了L1CAM蛋白上979位点的核心岩藻糖基化是HCC细胞转移的潜在调节因子。

 作为一款专注于完整糖肽水平上糖蛋白质组定量的工具,pGlycoQuant兼容了多种搜索引擎的鉴定结果,支持多种定量策略。在广泛适用的同时,大幅度减少了大规模糖蛋白质组数据的定量缺失值,提高了定量准确性。pGlycoQuant为差异位点特异性糖基化蛋白质组学研究提供了高效定量工具,期待其能够助力糖基化相关诊疗标志物研究。

 曹纬倩团队的主要研究方向是糖蛋白质组学方法开发和应用研究,刘超团队的主要研究方向是计算蛋白质组学技术开发。此前,曹纬倩副研究员所在的复旦大学杨芃原(1949.6.12-2021.5.31)团队和刘超副研究员所在的中科院北京计算所贺思敏团队长期深度合作,曾在Nature Methods,Nature Communications共同合作发表了完整糖肽解析工具pGlyco3,pGlyco2.0。本工作是他们在该研究领域合作取得的又一重要成果。

上海复旦大学生物医学研究院博士研究生孔思远、北京航空航天大学生物医学与工程学院博士研究生宫鹏云、德国马克斯普朗克生物化学研究所曾文锋博士和上海复旦大学生物医学研究院蒋碧云博士为该论文共同第一作者。曹纬倩副研究员和刘超副研究员为共同通讯作者。同时中科院北京计算所贺思敏研究员和复旦大学杨芃原教授(1949.6.12-2021.5.31)给予了本研究项目重要支持。该项目得到国家自然科学基金委面上项目,国家重点研发计划,上海市高水平地方高校创新研究团队以及河南省科学技术厅的支持。

全文链接:https://doi.org/10.1038/s41467-022-35172-x


Top