EMBO Molecular Medicine丨刘晓慧博士等报道利用临床蛋白质组技术助力颅内动脉瘤血清标志物鉴定及相关发病机理表征

科学研究

2022年

首页科学研究科研进展 2022年

EMBO Molecular Medicine丨刘晓慧博士等报道利用临床蛋白质组技术助力颅内动脉瘤血清标志物鉴定及相关发病机理表征

发表时间：2022-01-05　　|　　阅读次数：2785次　　|　　字体大小 [ 小中大 ]

颅内动脉瘤（Intracranial aneurysm，IA）是一种人群内发病率较高的疾病，占到普通人群的2-3%，同时颅内动脉瘤每年破裂出血率为1.9%。破裂动脉瘤出血是引起蛛网膜下腔出血（Subarachnoid hemorrhage，SAH）的主要原因，出血导致直接脑损害以及迟发的脑缺血，因而该疾病致死率和致残率极高。据报道，大约三分之一的SAH患者死亡，三分之一的幸存者亦多有残疾或明显的神经功能损伤。目前针对IA的诊断，尚依赖于影像学判断如数字减影血管造影（DSA）、磁共振血管造影（MRA）以及CT血管造影（CTA）等，成本高、效率低；同时作为诊断颅内动脉瘤金标准的DSA，由于其检查的有创性和形态学参数的宽泛性并不适合“精准医学”的要求。而针对具有破裂潜能的IA，尚无可用于预测的标志物。

2022年1月3日，我院刘晓慧博士联合华山医院冷冰主任医生在EMBO Molecular Medicine杂志上在线发表一篇题为“Circulating proteomic panels for risk stratification of intracranial aneurysm and its rupture”的论文，通过建立基于质谱的全面血清标志物筛选方法，揭示了可能存在的颅内动脉瘤临床血清标志物以及疾病发生发展可能的机制。

颅内动脉瘤血清标志物研究有几大难点： 1）由于血清蛋白浓度动态范围达到12个数量级，导致直接的血清蛋白质组研究深度不够；2）颅内动脉瘤是脑血管凸起类疾病，其分泌到外周血中的因子含量极少；3）颅内动脉瘤手术常通过栓塞或者夹闭等方式处理，临床组织样品获取困难，且量少。为了尽可能找到外周血中的临床诊断标志物，研究者首先针对IA的手术切除组织和血清开展系统的蛋白质组学研究，建立了目前已报导鉴定量最大的动脉瘤组织和血清轮廓谱，在组织和血清中分别鉴定到5915个蛋白质和1557个蛋白质，分别找到724个差异蛋白和144个差异蛋白，并对之进行深度的生物信息学分析，为动脉瘤机制研究和标志物寻找提供参考。在此基础上，建立了针对特定疾病的全面血清标志物验证策略，不单依赖于单实验室血清中鉴定到的潜在差异蛋白，同时结合组织分泌的蛋白和文献既往研究结果，构建了一个全面的IA潜在血清蛋白质标志物数据库（SPCBB）——包含717种蛋白，使得目标标志物验证工作更加灵活与全面（图1）。

图1 血清候选生物标志物库的构建流程

研究者利用实验室前期发展的DeepDIA技术（Nat Commun，2020，doi: 10.1038/s41467-019-13866-z），即针对特定质谱仪器（Instrument specific）的数据进行深度学习建立模型，从而对肽段的质谱表现进行预测技术，作者提出了DeepPRM靶向验证策略，通过调整和优化质谱数据深度学习方法，针对SPCBB中的717种蛋白质，预测其特征肽段可检出性和保留时间，并在大规模血清队列（队列I = 212，队列II = 32）中进行PRM验证（图2）。该方法极大程度上降低了传统靶向蛋白质验证中的标准肽段合成成本，提高了效率。

图2 DeemPRM方法以及大规模血清样品靶向蛋白组

进一步，本研究在PRM队列I（n=212）血清靶向蛋白组数据的基础上，开发了一套筛选IA生物标志物的计算流程，靶向定量数据在经历1）差异蛋白筛选；2）候选特征选择和模型构建的两步处理后，可以高效找到准确度（Ac）最高的分子标志物组合（图3A）。

利用上述计算流程，对于IA (破裂动脉瘤（R） &未破裂动脉瘤（UR）) 患者和健康对照的分类，作者在训练集（75%的队列I）上鉴定了一个包含六种蛋白质的标志物组合（P6），包括组织蛋白酶 G（CTSG）、PDZ 和 LIM 结构域蛋白 1（PDLIM1）、成髓细胞蛋白（PRTN3）、髓过氧化物酶（MPO）、免疫球蛋白重常数 mu（IGHM）和免疫球蛋白 kappa 变量 3-20 （IGKV3-20）。随后，在内部验证集（25%的队列I）和外部验证集（队列II，n=32）中分别进行验证，鉴定准确率高达87.50%（图3B-D）。

潜在的 IA 破裂是一种复杂且具有挑战性的情况，使临床医生在选择治疗方案时常陷入两难。为了对破裂动脉瘤（R）和未破裂动脉瘤（UR）进行分类，研究者利用上述计算流程鉴定了一个含八种蛋白的标志物组合（P8），其中包括α-胰蛋白酶抑制剂重链 H4 (ITIH4)、载脂蛋白 A-IV (APOA4)、纤维蛋白原 γ 链（FGG）、纤连蛋白 (FN1)、软骨寡聚基质蛋白 (COMP) 、免疫球蛋白重常数 mu（IGHM）和免疫球蛋白 kappa 变量 3-20 （IGKV3-20）。该组合在内部验证集中产生了85.19%的分类准确度，在外部验证集中达到了91.67%的分类准确度，进一步证明了该模型的稳健性（图3E-G）。

图3 使用机器学习方法识别潜在的生物标志物组合

最后，作者在包括 40R、 40UR以及 40 名健康对照的额外队列 (III) 中使用 ELISA 进一步验证了两种低丰度蛋白 PRTN3（源于组织蛋白组）和 CTSG（源于血清蛋白组），显示了与 PRM高度一致的结果（图4）。

图4 IA生物标志物的血清学验证

该研究建立了目前已报导鉴定量最大的动脉瘤组织和血清轮廓谱，同时建立了结合当前实验和既往研究结果，针对特定疾病的全面血清标志物验证策略；提出了一个基于深度学习的DeepPRM靶向验证技术，通过预测目标蛋白/肽段检出信息，准确检测并验证疾病血清中潜在的标志物；最后依据目标蛋白质的定量结果，通过机器学习，筛选高灵敏度和高特异性的颅内动脉瘤和预测IA破裂潜能的诊断蛋白质标志物，进一步帮助临床上对IA患者的及时检出和诊治。

复旦大学生物医学研究院博士研究生熊悦婷、上海交通大学医学院附属瑞金医院郑永涛和复旦大学附属华山医院闫研为该文的共同第一作者；刘晓慧高级工程师和附属华山医院冷冰主任医师为共同通讯作者。本研究得到了复旦大学生物医学研究院蛋白质组学和质谱平台的强有力支持。谨以此文致敬永远的导师杨芃原教授。

原文链接：https://www.embopress.org/doi/full/10.15252/emmm.202114713