胰腺腺癌(PAAD)具有高度侵袭性和预后不良的特点。氧化应激对肿瘤的发生和发展有很大影响。然而,氧化应激相关基因对 PAAD 患者预后的预测作用仍不明确。本研究旨在构建一个基于氧化应激基因的 PAAD 预后模型,并评估其预测价值。
1. DEOSGs 鉴定
为了筛选与氧化应激相关的基因,作者按照流程图(图1)进行了研究。在 TCGA 数据库(训练集)中,共有 2994 个基因被鉴定为 mRNA 水平的 DEGs(图 2A)。在 GSE28735、GSE62165 和 GSE62452 中,分别有 4603、7291 和 4428 个基因被鉴定为 DEGs(图 2B-D)。在上述鉴定出的 DEGs 中,有 356 个 DEGs 是四个数据集共有的(图 2E),其中 55 个基因与氧化应激有关,被鉴定为 DEOSGs(图 2F)。考虑到基因表达水平(每百万映射读数中每千碱基转录本片段的平均值(FPKM)> 1),55 个 DEOSGs 中的 52 个被选中进行进一步分析。
图1 研究流程图
图2 识别不同表达的 OS 基因
2. 预后模型的构建与评估
为了构建预后模型,进一步应用52个DEOSGs分析它们与PAAD患者预后的关系。首先,通过单变量考克斯回归分析,确定了22个P<0.05的基因为PAAD预后相关基因,并在森林图中列出了前10个预后相关的DEOSGs(图3A)。然后,通过 Kaplan-Meier 分析选出了与总生存期明显相关的 12 个基因(图 3B),并对其中 P < 0.1 的 4 个基因(MET、CDK1、CTTN、FYN)进行了多变量 Cox 回归分析(图 3C)。最后,应用上述四个基因构建预后模型
图3 为 PAAD 患者构建预后模型和提名图
为了提高临床应用性,作者联合应用风险评分和患者信息建立了一个预测模型。在年龄、性别和临床分期这三个具有完整临床信息的参数中,临床分期与患者的预后有显著相关性,而患者的预后与性别和年龄没有显著相关性(图 3D)。结合上述四个基因的表达水平和 PAAD 患者的临床分期信息,构建了一个可以预测 PAAD 患者 1 年和 2 年 OS 概率的提名图(图 3E)。
此外,作者还分析了风险评分与患者生存时间、生存状态或上述四种基因表达水平之间的关系。如图 4A 所示,随着风险评分的增加,患者的整体生存概率明显下降。不出所料,风险因子 MET 和 CDK1、CTTN 的表达随着风险评分的增加呈上升趋势;相反,保护因子 FYN 的表达随着风险评分的增加呈下降趋势(图 4A)。最后,作者用对数秩检验评估了高风险组和低风险组的生存概率,结果显示预后差异显著(P = 1.5 x 10 -5 )(图 4B)。此外,时间 ROC 分析表明预测模型是可信的,训练集 1 年和 2 年 OS 的曲线下面积(AUC)分别为 0.87 和 0.91,验证集分别为 0.74 和 0.81(图 4C 和 D)。这些数据表明,由这四个氧化应激基因构建的预后模型对 PAAD 患者的预后具有良好的预测能力。
图4 对训练集 PAAD 患者总生存期预后模型的评估和验证
3. 对训练集 PAAD 患者总生存期预后模型的评估和验证
为了探究参与PAAD高危或低危患者不同预后的潜在信号通路,作者进行了GSEA分析。结果显示,与高风险患者相比,低风险患者有几条通路明显富集,其中包括 B 细胞活化(NES=-1.62,P < 0.001)、B 细胞增殖(NES=-1.73,P < 0.001)、白细胞介导的免疫(NES=-1.52,P < 0.001)、白细胞增殖(NES=-1.44,P < 0.001)、T 细胞活化(NES=-1.36,P < 0.001)、T 细胞受体复合物(NES=-1.82,P < 0.001)、趋化因子信号通路(NES=-1.63,P<0.001)、免疫受体活性(NES=-1.62,P<0.001)和趋化因子信号通路(NES=-1.63,P<0.001)(图 5A)。此外,谷氨酸受体信号通路(NES=-1.90,P<0.001)、胰岛素分泌(NES=-1.77,P<0.001)以及甘氨酸、丝氨酸和苏氨酸代谢(NES=-1.67,P<0.001)这3条与细胞代谢相关的通路也在低风险患者中显著富集(图5B)。相反,DNA修复(NES=1.52,P<0.001)、重组修复(NES=1.41,P<0.0019)和细胞周期(NES=-2.01,P<0.001)等3条重要通路在高危患者中明显富集(图5C)。在PADD基因突变方面,高危组和低危组的突变总数分别为10717和864(图5D)。高风险组突变频率最高的前 10 个基因是 TP53、KRAS、CDKN2A、SMAD4、RNF43、TTN、MUC1、ADAMTS12、FLG 和 KMT2D,而低风险组突变频率最高的前 10 个基因是 TP53、KRAS、CDKN2A、SMAD4、RNF43、TTN、TGFBR2、SYNE1、PKHD1 和 FLRT2(图 5E)。至于两组共有的六个基因(TP53、KRAS、CDKN2A、SMAD4、RNF43、TTN),高风险组的突变频率也高于低风险组(图 5F)。这些结果表明,免疫相关通路和代谢通路在低风险组明显富集,而 DNA 修复通路在高风险组明显富集。
图5 PAAD 高危和低危患者的功能 GSEA 和基因突变分析
由于大部分富集的通路与免疫系统有关,作者转而对高风险组和低风险组进行免疫浸润分析。如图 6A 所示,在 28 个免疫细胞中,有 23 个细胞在高风险组和低风险组之间发生了显著变化。在这 23 个免疫细胞中,19 个细胞(活化的 B 细胞、活化的 CD8 + T 细胞、活化的树突状细胞、中心记忆 CD4 + T 细胞、效应记忆 CD4 + T 细胞、效应记忆 CD8 + T 细胞、嗜酸性粒细胞、未成熟的 B 细胞、未成熟的树突状细胞、巨噬细胞、肥大细胞、MDSC 细胞)发生了明显变化、巨噬细胞、肥大细胞、MDSC、单核细胞、自然杀伤 T 细胞、自然杀伤细胞、浆细胞状树突状细胞、调节性 T 细胞、T 滤泡辅助细胞和 1 型 T 辅助细胞)与风险评分呈显著负相关。相反,包括 CD56dim 自然杀伤细胞、中性粒细胞、17 型 T 辅助细胞和 2 型 T 辅助细胞在内的 4 种细胞与风险评分呈显著正相关(P < 0.05)。由于23种明显改变的免疫细胞中有10种与T细胞有关,作者推测这4种氧化应激相关基因预后模型与T细胞免疫有密切关系。考虑到最近基于检查点的免疫疗法取得了突破性进展,作者对高风险组和低风险组的 25 个免疫检查点基因进行了差异表达分析。结果显示,CD47、TNFSF9 和 PVR 与风险评分呈正相关;而 HLA-DQB1、CD96、SIRPA、CD48、HLA-DRB1、BTN2A2、HLA-DOA、HLA-DPA1、HLA-DPB1、HLA-DMB、HLA-DMA、BTNL9、HLA-DRA、CD27 和 HLA-DOB 则呈相反趋势(图 6B)。
图6 免疫浸润和免疫相关基因分析
从 GSEA 和免疫浸润分析中,作者注意到高风险组和低风险组的 T 细胞活化存在显著差异。因此,作者对高风险组和低风险组之间的 29 个 T 细胞增殖基因进行了差异表达分析。对合成的 T 细胞增殖驱动基因的分析表明,LTBR、IL1RN、BATF、AHNAK、SLC10A7、CLIC1、RAN、CDK2、CDK1 和 AHCY 与风险评分呈正相关;而 CXCL12、NFYB、FOSB、CYP27A1、GPD1 和 ITM2A 则呈相反趋势(图 6C)。综上所述,作者的数据揭示了氧化应激可能通过激活CD4 + T和CD8 + T细胞重塑肿瘤免疫环境,从而影响PAAD患者的预后。
利用 ICIs 进行免疫治疗给 PAAD 患者带来了巨大的希望,因此作者通过 TIDE 算法分析了 ICI 治疗的耐药性。如图 6D 所示,高危组中的 TIDE 评分、排除评分和功能障碍评分均显著增加,这表明高危患者的免疫逃逸潜能增加,因此 ICI 的疗效可能较差。
4. 四种预后 DEOSGs 的表达验证
为了验证四种预后DEOSGs在PAAD中的表达水平,作者首先通过CPTAC数据库和免疫组化(IHC)染色检测了它们的蛋白水平。作者发现,与正常组织相比,PAAD 中四种预后 DEOSGs 的蛋白水平均明显升高(图 7A)。同时,IHC 染色结果进一步验证了这四个基因在 PAAD 患者中的高表达(图 7B、C)。此外,与蛋白水平一致,与邻近癌旁组织相比,MET、CDK1、CTTN 和 FYN 的 mRNA 水平在 PAAD 中也显著上调(图 7D)。综上所述,作者的研究结果表明,PAAD中四种预后性DEOSGs的表达均呈上调趋势,这表明PAAD中四种预后性DEOSGs的联合高表达可能与患者的不良预后有关。
图7 四个 DEOSG 基因在蛋白和 mRNA 水平上的验证
总结
总之,作者为 PAAD 患者构建了四个与氧化应激相关的预后模型。在作者的模型中,风险评分与免疫浸润水平,尤其是免疫反应、T 细胞活化和免疫治疗的效率有明显的相关性。作者的模型有望为临床个体化治疗的预后预测和疗效监测提供指导。