肝细胞癌是一种高发病率和高死亡率的恶性肿瘤。因此,建立有效的HCC预后模型并指导临床治疗具有重要意义。蛋白乳酸化修饰在HCC肿瘤中发现,并与HCC进展有关。
1. 鉴定HCC中的预后乳酸化修饰相关基因
图1显示了研究的总体过程。对具有HBV DNA、HCV RNA、基因型或抗体的患者进行鉴定。HBV感染者223例,HCV感染者133例。从TCGA数据库中获得365个癌症组织和50个配对相邻组织的mRNA数据以及相应的临床信息。筛选出差异表达基因(DEGs)和预后乳酸化修饰化相关基因。最终,作者确定了16种与乳酸化相关的预后DEG:ARID3A/DRIL1、CCNA2、DDX39A/DDX39、EHMT2/KMT1C、FABP5、G6PD、H2AX/H2AFX、HMGA1、KIF2C/KNSL6、MKI67、PFKP、PKM2、RACGAP1/CYK4、RFC4、STMN1和TKT。预后基因和DEG的数量如Venn图所示(图2A)。构建热图以显示这些乳酸化相关DEG的表达水平(图2B)。如热图所示,16个基因在癌症组织中的表达水平均高于相邻组织。还构建了一张森林图,显示这些基因都是具有不同风险比(HR)的风险基因(图2C)。然后,作者使用STRING进行PPI分析。图2D中的PPI网络表明,这些基因编码的大多数蛋白质以复杂的方式紧密相连。值得注意的是,主要参与葡萄糖代谢和糖酵解的四个基因,PFKP、PKM2、G6PD和TKT,在PPI网络中显示出广泛的相关性。PPI网络显示了目前已知的相互作用,并预测了预后DEG编码的蛋白质之间的相互作用。图2E显示了基因相关性分析的结果。在转录组水平上观察到以下基因之间的强正相关性:KIF2C和MKI67、RACGAP1、RFC4、STMN1;MKI67和RACGAP1;PKM2和PFKP。
图1 研究工作流程图
图2 HCC预后乳酸化修饰化相关基因的鉴定
2. 在TCGA队列中构建预测模型
根据16个交集基因的表达水平进行LASSO-Cox回归构建预后模型。基于λ的最优值获得了一个八基因模型(图3A),图3B显示了最低的部分似然偏差。根据每个患者的计算风险评分,TCGA队列中的患者被分为高风险组和低风险组(图3C)。正如预期的那样,Kaplan–Meier生存曲线显示,高风险组的生存率低于低风险组(p=6.915×10−7)(图3D)。一贯地,随着风险评分的增加,高危组患者的生存时间更短(图3E)。作者进一步进行了t分布随机邻居嵌入(t-SNE)、主成分分析(PCA)和ROC分析,以在多个维度上评估预后模型。如图3F,G所示,该模型清楚地将患者分为两个亚组。1年时曲线下面积(AUCs)为0.767,2年时为0.710,3年时为0.671,表明该模型对HCC具有令人满意的预测效果(图3H)。
图3 TCGA队列中预后标志的构建
3. 在ICGC队列中验证预后的丙酰化相关特征
在ICGC队列中验证了基因特征的预后价值。根据公式计算的风险评分,总共有231名患者被分为高风险组和低风险组。PCA和t-SNE分析证实,风险模型明确将患者分为两组。Kaplan–Meier曲线还表明,高危组患者的生存概率低于低危组患者(p=0.003129)。同样,在两个亚组中观察到生存时间和风险评分的一致趋势,这表明随着风险评分的增加,高危组中存活的患者数量减少。风险评分模型在1年时AUC达到0.742,2年时达到0.754,3年时达到0.75 8,显示出合理的预后价值。评估了高风险组和低风险组的甲胎蛋白(AFP)表达水平,结果显示,高风险组的AFP表达水平显著高于低风险组(p<0.001)。由于AFP是一种被广泛认可的HCC生物标志物,这一结果表明预后模型与AFP表达具有一致的预测功效。这结果表明,预后模型可以很好地将患者分为两个亚组,并有效地预测患者的预后。
4. 与乳酸化修饰相关的八个基因特征的独立预后价值
为了测量基因特征的独立预后价值和临床相关性,进行了单变量和多变量独立预后分析。使用“Survival”R包进行分析。年龄阈值设定为65岁。在分级方面,1级和2级患者被设为对照组,3级和4级患者被设定为实验组。同样,不同阶段的患者被分为对照组和实验组。在TCGA队列中,单变量分析显示,分期和风险评分均与总生存时间显著相关,风险评分的风险比为3.129(95%可信区间:2.234–4.383,p值<0.001)(图4A)。多变量分析证实了临床相关性,其危险比为2.794(95%可信区间:1.984–3.936,p值<0.001)(图4B)。此外,在ICGC队列中,风险评分模型还表明,该风险模型是HCC OS的可靠独立预后因素(HR=4.308,95%CI:2.452–7.569,p值<0.001;HR=3.734,95%CI:2.071–6.731,p值p<0.001)(图4C和图5D)。总之,这些数据表明,8基因预后特征与临床预后具有良好的相关性,并且可以独立预测临床结果。
图4 单变量和多变量独立预后分析
图5 功能注释分析与糖酵解途径GSEA
5. 功能注释和糖酵解途径GSEA
为了确定根据基因特征划分的高风险组和低风险组之间的不同功能途径,作者在TCGA和ICGC数据库中进行了GO注释分析。在TCGA队列中,免疫相关过程在很大程度上富集,如体液免疫反应、淋巴细胞介导的免疫和免疫球蛋白介导的免疫力(图5A),而DNA复制和转录,包括细胞核分裂、有丝分裂核分裂和染色体分离,在ICGC队列中富集(图5B)。由于蛋白质乳酸化修饰化与糖酵解密切相关,作者在肿瘤组织和邻近组织中进行了糖酵解途径GSEA。正如预期的那样,GSEA结果表明,与邻近组织相比,癌症组织中的糖酵解途径在很大程度上富集(图5C)。
6. TIME景观分析与治理响应性评价
由于GO分析表明通路富集与肿瘤免疫微环境(TIME)有关,作者进行了ssGSEA来评估TCGA和ICGC队列中的免疫细胞浸润和免疫功能。在TCGA和ICGC队列中,高风险组的免疫细胞丰度显著高于低风险组。在TCGA队列中,高危组中aDC、iDC和Tfh、Th1、Th2和Treg细胞水平较高,而ICGC队列中高危组中的aDC、DC、巨噬细胞、NK细胞、pDC以及Tfh、Th2和Treg细胞水平较高。然而,TCGA队列中的肥大细胞和NK细胞以及ICGC队列中的NK细胞显示出相反的趋势。除I型IFN反应和II型IFN响应外,大多数免疫相关途径在高危组中上调。
作者评估了治疗反应性,以探讨乳酸化修饰化相关的预后模型是否可用于指导HCC患者的治疗。本研究分析了多种化学药物和靶向药物。作者发现,在治疗高危组患者时,化疗中使用的化学药物,如5-氟尿嘧啶、丝裂霉素C和紫杉醇的IC50值显著低于低风险组(图6A–C)。这一发现表明,高危组患者可能比低风险组患者从这些化学药物中受益更多。对于靶向小分子抑制剂,结果显示,低风险组的患者对FH535和拉帕替尼更敏感,而索拉非尼在高风险组的IC50较低(图6D-F)。TIDE被广泛用于评估对免疫疗法的反应性。TIDE值越高表示对免疫疗法的反应越有效。图6G显示,高风险组患者对免疫疗法的反应比低风险组更差。
图6 TCGA队列中治疗反应性的评估
7. 特征基因结构分析和突变分布
为了进一步探索来自签名的每个基因的乳酸化修饰的可能影响,作者使用了来自cBioPortal数据库的肝脏数据来确定基因的结构域和突变条件。每个基因的结构域如图7A–H所示。图7I显示了八个基因的聚集突变条件:ARID3A/DRIL1、CCNA2、DDX39A/DDX39、G6PD、KIF2C/KNSL6、PFKP、PKM和TKT。
图7 特征基因结构和突变分布
8. 糖酵解速率限制酶PKM2的预后研究
PKM2是一种预后乳酸化修饰化相关的DEG,是基因特征的一部分。根据其表达水平,TCGA队列中的患者(N=365)可分为高危组(N=93)和低危组(N=272)(图8A),表明PKM2高表达与预后较差有关。评估PKM2表达的相关性和由此产生的临床特征。PKM2表达与患者年龄无关(阈值65岁)(图8B)。女性与较高的PKM2表达相关(图8C)。生存条件也与PKM2表达相关,PKM2高表达与死亡相关(图8D)。某些HCC分级与PKM2表达之间也存在相关性(图8E)。免疫细胞浸润分析还表明,PKM2高亚组和低亚组之间的M0巨噬细胞和活化肥大细胞存在差异(图8F)。
图8 PKM2表达、临床特征和免疫细胞浸润之间的相关性
总结
作者鉴定了预后DEG,并基于乳酸化相关基因开发了HCC的预后基因标记。糖酵解途径的丰度和时间也进行了分析。该基因标记为临床治疗提供了一种实用的药物反应性评估。总之,本研究为预测HCC预后提供了一种实用的基于乳酸化的基因标记,并为乳酸化修饰研究提供了一个新的视角。