Genome-Wide Analysis of Serine Carboxypeptidase-Like Acyltransferase Gene Family for Evolution and Characterization of Enzymes Involved in the Biosynthesis of Galloylated Catechins in the Tea Plant (Camellia sinensis)
茶树(Camellia sinensis)中丝氨酸羧肽酶样酰基转移酶基因家族的全基因组分析及其在没食子酰化儿茶素生物合成中相关酶的进化和特征分析
茶树(山茶属)CCoAOMT基因家族的全基因组鉴定、表达分析和蛋白质相互作用分析-全基因组家族分析-文献精读13
两种参与茶树O-甲基化儿茶素生物合成的O-甲基转移酶的特征分析-文献精读20
摘要
茶树(Camellia sinensis L.)的叶片能够合成并积累大量的没食子酰化儿茶素(如EGCG和ECG)和非没食子酰化儿茶素(如EGC、儿茶素和表儿茶素),总共占干叶质量的8%–24%。没食子酰化儿茶素是茶叶中可溶性儿茶素的主要成分(可达75%),对绿茶的涩味和苦味以及其对人类健康的药理活性有着重要贡献。然而,茶树中儿茶素没食子酰化的分子机制在很大程度上尚不清楚。先前的研究表明,葡萄糖基转移酶和丝氨酸羧肽酶样酰基转移酶(SCPL)可能参与这一过程。然而,SCPL在没食子酰化儿茶素生物合成中的具体作用仍需进一步研究。在本研究中,我们对茶树基因组中的SCPL基因进行了全基因组鉴定。一些SCPL基因被分入IA类群,该类群中包含先前已被鉴定具有酰化功能的SCPL-IA酶。该类群中有28个茶树基因在嫩叶和营养芽中呈差异表达。我们利用重组酶对三种具有没食子酰化活性的SCPL-IA酶(CsSCPL11-IA、CsSCPL13-IA、CsSCPL14-IA)进行了鉴定。这些SCPL-IA基因的表达水平与茶树中没食子酰化儿茶素的积累相一致,其重组酶表现出β-葡萄糖没食子酸:儿茶素没食子酰基转移酶活性。该研究首次揭示了编码葡萄糖没食子酸:儿茶素没食子酰基转移酶的基因,并阐明了其在茶树中没食子酰化儿茶素生物合成中的活性作用。
引言
植物代谢物,特别是一些特化化合物,会经历多种修饰过程,如糖基化、丙二酰化、甲基化、酰基化和异戊烯基化(Bowles et al., 2005; Kosma et al., 2012; Bontpart et al., 2015; Ahmad et al., 2017)。这些修饰进一步增加了植物特化代谢物的多样性,并生成具有附加理化特性的活性分子,从而赋予原始代谢物所不具备的新生物学功能(Wang et al., 2019)。植物基因组进化出大量编码修饰酶的基因家族,以应对不利环境并抵御病原体和草食动物的攻击(Wilson et al., 2016)。在这些修饰中,酰基化是植物代谢物中最常见且最重要的修饰之一,包括酚类、脂质屏障、糖类和多胺。酰基化的多样性使植物在代谢和生理过程中,以及在应对生物或非生物胁迫的防御反应中获得许多功能(Bontpart et al., 2015; Wilson et al., 2016)。
植物酚类是广泛存在的特化代谢物,包含一个至少有一个羟基的酚环(Bontpart et al., 2015)。它们参与生长、发育和防御反应。作为植物中研究最广泛的特化代谢物,酚类的生物合成途径已被详细研究,涉及多种修饰类型,如酰基化,最终产生各种各样的酚类产物。此外,由于大多数植物中简单酚类的高可得性,它们不仅常作为酰基化的受体分子,还在其他类型的代谢物修饰过程中作为能量丰富的供体分子被修饰(Bontpart et al., 2015; Wilson et al., 2016)。目前已经描述并表征了两大类使用酚类化合物作为受体或供体分子的酰基转移酶家族,每个家族使用不同类型的酰基供体(Bontpart et al., 2015)。BAHD酰基转移酶是以家族中最早被生化表征的四种酶(BEAT、AHCT、HCBT和DAT)命名的,它们在广泛的植物特化代谢中得到深入研究,并以酰基辅酶A硫酯作为供体分子(Schilmiller et al., 2012; Bontpart et al., 2015; Wilson et al., 2016; Zhang et al., 2018)。另一方面,丝氨酸羧肽酶样(SCPL)酰基转移酶使用1-O-β-葡萄糖酯作为酰基供体,催化多种酚类、酸类、皂苷及其他化合物的转酰化反应,这类酶的发现是近年的研究成果(Mugford and Milkowski, 2012)。
SCPL酶与丝氨酸羧肽酶在序列上具有同源性(Steffens, 2000; Milkowski and Strack, 2004; Bontpart et al., 2015)。SCPL酶可以产生多种酚类化合物,如β-1-肉桂酰-D-葡萄糖、芥子酰酯和没食子单宁(Wilson et al., 2016)。然而,直到21世纪初才首次鉴定出编码SCPL的基因(Lehfeldt et al., 2000; Li and Steffens, 2000)。SCPL酶赋予多种化合物生物学意义,例如,拟南芥中的芥子酰葡萄糖:苹果酸芥子酰基转移酶(Lehfeldt et al., 2000)、芥子酰葡萄糖:胆碱芥子酰基转移酶(Shirley and Chapple, 2003)、芥子酰葡萄糖:芥子酰葡萄糖芥子酰基转移酶(Fraser et al., 2007)、芥子酰葡萄糖:花青素芥子酰基转移酶(Fraser et al., 2007)。这些酶利用1-O-芥子酰-β-D-葡萄糖分别形成芥子酰苹果酸、芥子酰胆碱(芥子碱)、1,2-二-O-芥子酰-β-D-葡萄糖和芥子酰化花青素。随后,在油菜中也表征了两个同源基因BnSCT1和BnSCT2(Milkowski and Strack, 2004; Weier et al., 2008)。没食子酸是一种存在于多个双子叶植物中的三羟基苯甲酸(Karas et al., 2017)。没食子酰化黄酮-3-醇在保护植物细胞膜免受氧化损伤方面起着重要作用(Saffari and Sadrzadeh, 2004)。在十字花科植物中,UDP-葡萄糖:芥子酸葡萄糖基转移酶合成芥子酰葡萄糖(Milkowski and Strack, 2004),而在葡萄中,三种UGT形成羟基肉桂酰葡萄糖酯和β-葡萄糖没食子酸(Khater et al., 2012),这些是被若干SCPL使用的。葡萄(Vitis vinifera)中三种葡萄糖基转移酶基因VvgGT1至3也已被分离和表征(Khater et al., 2012)。此前,在茶叶中已经报道了一种纯化的多肽,具有表儿茶素:1-O-没食子酰-β-D-葡萄糖O-没食子酰基转移酶活性(Liu et al., 2012)。没食子酰葡萄糖酯,如没食子酰1-O-β-D-葡萄糖(β-葡萄糖没食子酸),作为没食子酰化黄烷-3-醇的酰基供体是必要的。茶树(Camellia sinensis)叶片的粗蛋白提取物中的UDP-葡萄糖基转移酶将葡萄糖和没食子酸生成β-葡萄糖没食子酸(Liu et al., 2012),但编码该酶的基因尚未报道。
儿茶素是茶叶中可溶性黄烷-3-醇的总称,包括六种主要类型,分别是(−)-表儿茶素(EC)、(+)-儿茶素(C)、(−)-表没食子儿茶素(EGC)、(+)-没食子儿茶素(GC)、(−)-表儿茶素-3-没食子酸酯(ECG)和(−)-表没食子儿茶素-3-没食子酸酯(EGCG)(Wei et al., 2018; Zhao et al., 2020)。其中,没食子酰化儿茶素(如EGCG和ECG)和非没食子酰化儿茶素(如EGC、C和EC)总共占干叶质量的8%–24%。作为茶叶的特色,没食子酰化儿茶素占总儿茶素的75%,对绿茶的涩味和苦味以及其对人类健康的多种药理活性起重要作用(Zhao et al., 2020)。尽管其重要性显著,儿茶素没食子酰化的分子和遗传基础仍然在很大程度上尚未被探究。茶树叶片中,几种黄酮类3′-羟化酶和黄酮类3′,5′-羟化酶是分别控制EC和EGC产生的两类酶,这是两种主要的非没食子酰化儿茶素(Wei et al., 2015)。作为没食子酰化黄烷-3-醇和黄酮醇的前体,β-葡萄糖没食子酸或多没食子酰葡萄糖在核心真双子叶植物中普遍存在(Moore et al., 2005; Liu et al., 2012; Wilson et al., 2016; Ciarkowska et al., 2018)。在橡树(Quercus spp.)中,观察到几种利用β-葡萄糖没食子酸合成没食子单宁的酶活性(Niemetz and Gross, 2005)。此外,β-葡萄糖没食子酸作为没食子酰化儿茶素生物合成的前体,并在其他物种中,如茶树、葡萄和柿子(Diospyros kaki)中被酰化(Niemetz and Gross, 2005)。
材料与方法
茶树基因组中SCPL家族基因的鉴定
利用从基因组序列中获得的茶树(Camellia sinensis)蛋白质组数据集(Wei等,2018;The Tea Plant Information Archive – TPIA公共数据库1),通过BLASTP搜索已知的SCPL蛋白序列,以查找SCPL编码基因。通过Pfam数据库在每个检索到的序列中搜索SCP基序(PF00450),以确认其为潜在的SCPL蛋白。从TPIA注释中获取SCPL蛋白的特征信息,如氨基酸残基数量、基因结构(外显子/内含子排列)及其在基因组中的起始和结束位置。利用ExPASy工具Compute pI/Mw2,按照默认参数计算每个基因产物的物理参数,如分子量(Mw)和等电点(pI)。
SCPL基因的染色体定位、系统发育和基因结构分析
使用PhenoGram Plot3根据TPIA数据库中的信息创建SCPL基因在染色体上的定位图。为了探讨该基因家族的进化关系,利用功能上已表征的不同物种的蛋白质以及所有茶树基因组中编码的SCPL蛋白进行系统发育分析。使用MEGA 6.0(Tamura等,2013)中的Neighbor-Joining法构建未根系统发育树,并进行1000次重复的自展测验。利用Gene Structure Display Server v.2.0工具(Hu等,20154)确定茶树SCPL基因的外显子/内含子结构。
Ka和Ks比值的计算与进化选择分析
在线计算两对紧密相关的CsSCPL基因的同义(Ks)和非同义(Ka)替换率及其Ka/Ks比值,以评估每对CsSCPL旁系同源基因的选择模式。Ka/Ks比值<1、=1和>1分别代表负、 中性和正选择的假设。通过DATAMONKEY6中的FEL、IFEL、REL和SLAC测试确定正选择位点的进化信号。对于进化选择分析,利用CsSCPL cDNA序列作为输入,通过HyPhy程序重建系统发育树,并在MEGA 6中采用Nei-Gojobori法。基于Kimura-2参数模型的最大似然法用于推断基因的进化历史。使用不同的方法检测单个编码位点的间歇性多样化。混合效应进化模型(MEME)在单个分支位点水平上识别间歇性多样化选择和普遍正选择。Markov Chain Monte Carlo(MCMC)方法用于快速、不受约束的贝叶斯近似分析,以通过近似贝叶斯方法确定预定位点的强度(Murrell等,2012)。在GTR核苷酸模型中,参数ω = β/α在MEME中用于拟合数据。参数β:β– ≤ α 和 β+用于衡量选择压力,而β–,β+和α用于估计位点替换率的变化。基于χ2渐近分布的似然比检验(LRT)在p值<0.05时被认为显著。
保守基序的鉴定与启动子区域分析
通过MEME7对CsSCPL家族基因中的保守区域进行分析,并通过Pfam数据库8筛查其基因组组装。使用PlantCARE程序9识别每个CsSCPL基因起始密码子上游1.5 Kb启动子区域中的顺式作用元件。
基因表达的计算机分析
从茶树品种‘舒茶早’(Wei等,2018)的微阵列转录组数据中获取鉴定出的CsSCPL基因在七个组织(顶芽;嫩叶、中叶、老叶;根;茎;果实)中的公共基因表达数据(补充数据集S3)。
植物生长条件与处理实验
茶树(Camellia sinensis var. sinensis cv. Shuchazao)种子在生长箱中于22 ± 2°C的蛭石中萌发。对于铝(Al3+)处理,将一年生插条在Shigeki Konishi溶液(补充表S1)中进行水培,分别在酸性条件(pH 5.0,0.4 mM Al3+:对照)或Al3+暴露(pH 4.0,2.5 mM Al3+)下生长,生长箱设定光周期为16 h/8 h(光/暗)及温度23°C。收集在0 h、12 h、24 h和48 h的根系进行基因表达分析(Wang等,2017)。MeJA处理实验按照先前描述的方式进行(Shi等,2015):带有嫩茶芽的茶树枝条用100 μM茉莉酸甲酯(MeJA)溶液喷洒,而对照用蒸馏水处理。在0 h、12 h、24 h和48 h分别收集茶叶。按照先前的实验(Zhang等,2017),使用25% PEG或200 mM NaCl分别模拟植物的干旱和盐胁迫条件,持续0 h、24 h、48 h和72 h。对于冷处理,在冷积累(CA)过程中采集茶树叶片。对照:25°C;CA1.6 h:10°C持续6 h;CA1.7天:从10°C降至4°C持续6天;CA2.7天:从4°C降至0°C持续7天;DA.7d:恢复到25°C至20°C持续7天。对于遮荫处理,在安徽的20年生茶园中,在自然条件下(全日照)或通过网罩提供70%–90%遮荫的条件下生长茶树。按照先前报道的方式,在0 h、4 h、8 h、2天、4天、8天和14天时收集芽(Liu等,2018)。
RNA-Seq数据分析、基因表达分析及qRT-PCR验证
对茶树组织进行取样,立即清洗后快速冷冻于液氮中,并储存在−80°C以供RNA提取。总RNA使用RNA提取试剂盒(北京BIOTECH)进行提取。按照Illumina HiSeq2500文库制备试剂盒的操作手册合成文库。在Illumina HiSeq2500平台上进行RNA-Seq(PE150bp)测序。每个生物样本获得约6 Gb的总净数据集(Q30 ≥ 80%),以根据茶树基因组序列和注释进行分析(Wei等,2018)。利用eXpress计算每千碱基转录本每百万映射读数(RPKM)和读取计数。差异基因表达的分析按照之前发表的方法进行(Ahmad等,2020)。
从茶树信息档案中获取‘舒茶早’的转录组数据10。利用每百万片段每千碱基外显子数(FPKM)值来估计茶树八个组织(根、茎、老叶、成熟叶、嫩叶、顶芽、花和果实)及各种处理中的基因表达水平。利用Log10(FPKM)计算CsSCPL1A-AT基因的表达水平。数据用于量化CsSCPL基因在水培茶树插条根系中对Al3+和MeJA胁迫的响应(补充数据集S3)。利用Mev4.9.011以热图形式显示表达数据。潜在与没食子酰化儿茶素生物合成相关的CsSCPL1A基因的表达与代谢关联分析按照先前的研究进行(Shi等,2015;Liu等,2018;Wei等,2018)。
对CsSCPL-I基因表达与多个组织实验数据集中儿茶素含量的Pearson相关性进行分析。R包也用于评估基因表达与代谢以及整体基因表达之间的相关性。生成的热图由pHeatmap R包构建。深红色表示正相关值,浅红色表示负相关。转录组和代谢谱数据集来自茶树的不同组织(Wei等,2018)。
根据表达动态,选择五个茶树CsSCPL-I基因(即,CsSCPL2-I(TEA009664,NCBI Genbank登录号MK843824)、CsSCPL5-I(TEA034028;MK843825)、CsSCPL11-I(TEA023451;MK843826)、CsSCPL13-I(TEA034055;MK843827)和CsSCPL14-I(TEA027270;MK843828))用于通过qRT-PCR验证其在不同组织中的胁迫响应。基因特异性引物列于补充数据集S4中。利用iQ5实时PCR系统(Bio-Rad)在96孔板中进行,反应体积为20 μL。每次反应包括2.5 μL 2X Power SYBR Master Mix(Applied Biosystems),1 μL引物混合物(0.4 μL 10 mM每种引物+ 0.2 μL H2O)以及2 μL 1:30稀释的cDNA反应。基因表达使用内参基因CsACTIN(TEA002341)进行标准化。
CsSCPL重组蛋白的克隆与表达及酶活性测定
利用基因特异性引物扩增上述五个CsSCPL-I基因的开放阅读框(ORF)。在Mastercycler PCR设备(Eppendorf)上进行扩增,使用0.5 μL ExTaq DNA聚合酶(Takara)和2.0 μL 1:30稀释的cDNA作为模板。将凝胶纯化的PCR产物插入pGEM-T easy载体(Promega),转化至E. coli中,并通过测序验证。为了表达功能性SCPL蛋白,将编码CsSCPL11-IA和CsSCPL14-IA的ORF的缺失前150 bp并插入ATG密码子的截短CsSCPL,以及全长CsSCPL13-IA(补充图S2B),克隆到pDONR221(Invitrogen)中,然后利用LR重组酶(Invitrogen)重组到pDEST17中。将构建物转入E. coli Rosetta菌株中进行异源蛋白诱导。取已验证的单菌落,在10 mL含50 μg mL–1氨苄青霉素的LB培养基中于37°C下过夜培养。将过夜培养的细菌培养物1:100稀释到300 mL LB培养基中,并加入50 μg mL–1氨苄青霉素,在37°C下振荡培养。当OD600达到0.8到1.0时,加入0.2 mM异丙基-1-β-D-硫代半乳糖苷(IPTG),在25°C下继续培养。培养10小时后,收集培养物,12,000 rpm离心30分钟,重悬于20 mL裂解缓冲液【200 mM Tris-HCl(pH 8.0),0.1% Triton X-100,5 mM β-巯基乙醇】,冰上放置1小时。然后通过超声破碎细胞,在4°C下12,000 rpm离心30分钟。收集上清液,使用镍树脂纯化试剂盒(Promega)纯化蛋白。通过SDS-聚丙烯酰胺凝胶电泳(SDS–PAGE)检测蛋白提取物。
酶活性测定
酶活性测定使用50 μL总反应混合物,包含50 mM磷酸钾缓冲液(pH 6.0),1.0 mM儿茶素(C),表儿茶素(EC),没食子儿茶素(GC),表没食子儿茶素(EGC),0.4 mM 1,2,3,4,6-五-O-没食子酰-β-D-葡萄糖(PGG)和1.0 μg纯化的重组酶,以验证每个选定的CsSCPL的没食子活性。在30°C下反应20分钟后,加入等量的100%甲醇终止反应。样品利用高效液相色谱(HPLC)和液相色谱-质谱(LC-MS)进行分析(如Wei等,2018所述)。
酶动力学分析
通过Lineweaver-Burk作图获取CsSCPL11-IA、CsSCPL13-IA和CsSCPL14-IA的KM和VMax动力学参数,采用EC和EGC作为受体(浓度范围为0.5至50 mM),PGG(0.4 mM)作为供体底物,总反应体积为50 μL。还使用PGG(0.1至10.0 mM)作为酰基供体,EGC(固定浓度1.0 mM)作为受体底物,测量这些重组蛋白的PGG动力学参数。利用HPLC分析反应结果。
统计分析
本研究中至少使用3个生物重复,并进行至少2次重复以获得数据进行分析。通过ANOVA分析在各种条件下酶与对照之间的配对数据差异,随后进行Student's t检验(n = 3)。
结果
茶树基因组中SCPL基因挖掘
在茶树(Camellia sinensis)基因组中共鉴定出47个SCPL相关基因,并根据它们在不同系统发育类别中的分布进行了注释(补充数据集S1)。这些基因的编码区长度从717 bp(TEA034030)到1,758 bp(TEA034034)不等,平均长度为1,369 bp。CsSCPL基因产物的分子量范围在27.49 kD(TEA034030)到73.8 kD(TEA034056)之间,平均为51.41 kD。CsSCPL的等电点(pI)值从4.67(TEA010715和TEA016469)到9.97(TEA034027)不等,其中77%(36/47)的基因产物具有酸性pI值。蛋白质的亚细胞定位通过控制其获取和利用各种分子相互作用伙伴的能力,从而影响其功能。因此,蛋白质定位是为新发现的蛋白质的细胞功能构建假设时的重要信息(Scott等,2005)。约61%的CsSCPL-I蛋白预计定位于质膜,而65%的CsSCPL-II蛋白预计定位于溶酶体。同时,CsSCPL-I和CsSCPL-II类的其他成员被预测存在于溶酶体、细胞核、细胞质以及细胞外等其他细胞器中(补充数据集S1)。每个CsSCPL基因产物的详细信息见补充数据集S1。
CsSCPL的系统发育和基序分析
为了评估它们之间的进化关系,利用茶树蛋白序列、其他植物物种的功能已知SCPL序列以及水稻和拟南芥基因组中的SCPL序列构建了系统发育树(图1)。根据先前对水稻和拟南芥模型中SCPL蛋白的分类和结构特征,CsSCPL基因被分为三类:CsSCPL-I到CsSCPL-III。CsSCPL-I进一步分为两个亚类:CsSCPL-IA和CsSCPL-IB(图1)。所有47个茶树SCPL的注释根据它们的系统发育位置进行:27个归入CsSCPL-IA类群(CsSCPL1-IA到27-IA),而只有一个成员归入CsSCPL-IB(CsSCPL28-IB)。CsSCPL-II类群包含17个茶树蛋白(CsSCPL1-II到17-II),CsSCPL-III仅有两个成员(CsSCPL1-III和2-III)(图2A)。茶树CsSCPL-I成员与其他物种的许多SCPL交织在一起,但与大多数拟南芥SCPL分离开。利用MEME确定了CsSCPL蛋白的保守结构域(图2B)。共发现了10个基序,并通过Pfam和SMART数据库(Letunic等,2012)确认了它们的注释。前四个基序是丝氨酸羧肽酶酶的特异性基序,几乎存在于所有CsSCPL中(补充表S2;图2B)。所有CsSCPL的基序总体上都得到了很好的保守,尤其是在同一系统发育类别中。此外,每个类群中包含独特的基序——例如,基序5和10仅存在于CsSCPL-I类群中,这表明它们具有与各自类别相关的独特特征和潜在特定功能。
茶树SCPL家族基因与不同植物物种中已表征的SCPL基因的系统发育树。该树使用MEGA 6.0软件中的邻接法(NJ)构建。节点上标注了百分比引导值(1,000次重复)。各子类群以不同颜色标识:SCPL-I(蓝色)、SCPL-II(绿色)和SCPL-III(栗色)。
茶树CsSCPL基因的系统发育分析和保守基序分析。(A)CsSCPL基因的系统发育树通过MEGA 6.0软件使用邻接法(NJ)构建。节点上标注了百分比引导值(1,000次重复)。各子类群以不同颜色标识:SCPL-I(蓝色)、SCPL-II(绿色)和SCPL-III(栗色)。(B)ScSCPL蛋白的鉴定基序显示为彩色方框。CsSCPL蛋白根据其系统发育关系列出。
CsSCPL-I基因的外显子/内含子结构
为了了解CsSCPL-I基因的结构多样性,对其外显子/内含子组织进行了分析(图3A)。在CsSCPL-I类中发现了广泛的外显子数量变化,范围从6个(CsSCPL18-IA和20-IA)到14个外显子(CsSCPL13-IA和23-IA),平均每个基因有10个外显子(补充数据集S1;图3A)。约11%(3/28)的CsSCPL-I基因包含8个外显子,21%(6/28)包含9个外显子,14%(4/28)包含10个外显子,另有21%(6/28)包含11个外显子,其余40%(11/28)则包含12至14个外显子(补充数据集S1;图3A)。对五对CsSCPL旁系同源基因对的基因结构进行比较,发现只有一对(CsSCPL27-IA/25-IA)包含相同数量的外显子。
茶树CsSCPL基因的基因结构。(A)CsSCPL-I基因的结构图中,红色方框表示外显子,黑线表示内含子,蓝色方框表示UTR序列。底部的比例尺以千碱基(kb)为单位。(B)CsSCPL-I基因的scaffold位置和重复。每个scaffold的编号标示在其左侧。不同基因根据其在碱基对中的位置进行排列。
CsSCPL-I编码序列的染色体分布和进化分析
27个CsSCPL-IA基因不均匀地分布在茶树基因组装的12个不同的scaffold上(图3B)。有趣的是,虽然大多数scaffold上含有1至2个CsSCPL-I基因,但scaffold2990上包含了11个基因,并且这些基因中的大多数在系统发育树中聚集在一起(图1)。基因家族的扩展及其新功能化/次级功能化是植物中常见的现象,通常通过分段和串联基因重复发生(Zhang和He, 2005;Kong等,2007)。通过系统发育分析,我们得出结论,CsSCPL-IA类基因重复的主要方式是分段重复,而单一位点则持有串联重复。我们还发现了两对旁系同源基因对(SCPL9-IA/21-IA和12-IA/-IA)的串联重复,以及五对基因对的分段重复(SCPL16-IA/20-IA、13-IA/24-IA、22-IA/10-IA、6-IA/14-IA和19-IA/1-IA)(图3B)。
可以通过Ka/Ks比值评估编码序列的选择历史。为了研究重复的CsSCPL-IA成员的分化,我们确定了每个CsSCPL-IA旁系同源基因对的Ka和Ks值以及Ka/Ks比值。Ka/Ks比值<1、>1或=1分别表示基因对处于纯化(负)、正或中性选择压力下(Juretic等,2005)。七对CsSCPL-I旁系同源基因的Ka/Ks比值在0.88到1.67之间(补充表S3),表明不同的选择压力作用于每对基因。串联重复基因对的Ka/Ks比值为0.88和1.31(补充表S3),表明这些基因对也正在经历不同的选择压力。另一方面,所有分段重复的旁系同源基因对均处于强正选择压力之下(Ka/Ks介于1.18和1.67之间),除了SCPL6-IA/14-IA和19-IA/1-IA,它们处于纯化选择压力之下(Ka/Ks分别为0.89和0.88)(补充表S3)。
为了保持蛋白质的结构和功能,在进化过程中氨基酸位置的保守性是至关重要的。探索这一特征可以阐明选择压力的作用。通过MEC模型适应性选择测试估计的替换率变化表明,几处SCPL蛋白区域处于正选择压力下(补充图S1A)。超过5%(476个氨基酸残基中的26个)的CsSCPL-I氨基酸残基处于正选择压力下,而其余的则处于纯化选择(补充图S1A)。对于CsSCPL-II蛋白,所有残基都处于纯化选择压力下(补充图S1B)。
为了进一步证实选择压力,我们测试了其他模型。CsSCPL-I和CsSCPL-II成员在其编码位点上表现出不同的平均ω比值。结果显示,CsSCPL-I的ω比值>1,CsSCPL-II的ω比值=1(补充表S4)。这表明大多数CsSCPL-I编码位点受到正选择并包含暴露于纯化选择的保守氨基酸残基。为了精确选择测试,对M7和M8模型进行了比较。M8对数据的拟合程度显著高于M7。两类基因CsSCPL-I和CsSCPL-II在M8中显示出正选择位点,其中CsSCPL-I的ω值为6.2,占7%的位点;而CsSCPL-II仅有极少部分(0.001%)的位点处于ω值1.0(补充表S4)。因此,CsSCPL-I在M8模型中表现出比CsSCPL-II显著更高数量的正选择位点。不同的基于似然的方法表明,19个CsSCPL-I基因编码位点和仅3个CsSCPL-II基因编码位点处于正选择(补充表S4)。通过计算ω值,采用FEL、IFEL、REL和SLAC等多种测试来识别正选择的进化信号。每种分析检测到不同数量的正选择编码位点:对于CsSCPL-I基因,FEL、IFEL、REL和SLAC分别揭示了六、十、十四和七个编码位点;而对于CsSCPL-II基因,检测到的相应位点数量分别为七、十一、一和四个(补充表S4)。除了REL通过贝叶斯因子>20检测到正选择位点外,所有这些测试在P值<0.05时均显著。因此,这些分析一致发现了CsSCPL-I基因许多位点的正选择和CsSCPL-II基因中少量位点的正选择的可靠指示。
基于氨基酸位置的正选择
进化保守氨基酸位置的鉴定在理解蛋白质结构和功能方面起着重要作用。利用贝叶斯方法通过后验概率揭示功能相关位点。ω ≥ 1的氨基酸位置表示正选择。通过BEB对CsSCPL-I的平均长度1,377个氨基酸残基进行分析,发现19个位点处于正选择中。与此同时,对于CsSCPL-II平均长度的1,370个氨基酸残基,只有三个位置处于正选择(补充表S5)。这一结果表明,编码位点的鉴定可以解释选择压力,并指出SCPL蛋白中功能相关的氨基酸残基。
CsSCPL-I基因启动子序列的顺式元件分析
CsSCPL-I蛋白在植物中的确切功能仍不明确。描述特定基因在时间和空间上的表达对于确定其功能特别有用。每个细胞对环境刺激和内部信号的基因转录动力学最终由基因启动子区域中的顺式元件的模块化组成所控制。提取CsSCPL-I基因的启动子序列,并提交至PlantCARE以识别顺式调控元件(Lescot等,2002)。在CsSCPL-I基因的1.5 Kb上游区域中发现了许多元件(图4A–D;补充数据集S2)。28个CsSCPL-I基因中的26个基因的启动子中包含对光(约40%的基因)、激素(15%)、环境胁迫(25%)和植物生长(20%)有反应的元件(图4A)。此外,我们还识别了调控多种激素响应的转录因子结合位点(图4B)。在激素响应元件中,对GA敏感的元件在CsSCPL-I启动子中最为丰富,其次是对MeJA的响应。除光照外,其他非生物和生物胁迫也显著影响CsSCPL-I基因的表达(图4C)。分析中发现与植物生长相关的顺式元件最多的是胚乳相关元件(图4D)。
环境和激素对茶树中CsSCPL基因的调控。使用PlantCARE分析了每个CsSCPL-I基因1,500 bp的上游区域。(A)所有CsSCPL-I家族成员中,光响应元件、激素响应元件、环境胁迫相关元件和植物生长响应元件的百分比。(B)CsSCPL-I基因顺式作用元件区域中不同激素(ABA、乙烯、MeJA、生长素、赤霉素)响应元件。(C)CsSCPL-I基因顺式作用元件区域中不同环境胁迫(高温、低温、脱水、干旱、防御、厌氧、伤口和病原体)相关元件。(D)CsSCPL-I基因顺式作用元件区域中不同植物生长相关元件。(E–J)热图显示了各种条件下CsSCPL1A-AT基因的表达模式。实验中茶树‘舒茶早’的转录组数据来自茶树信息档案(http://tpia.teaplant.org/index.html)。CsSCPL1A基因在茶树八个组织(根、茎、老叶、成熟叶、嫩叶、顶芽、花、果实)中的表达水平经标准化为每千碱基外显子每百万片段(FPKM),并在热图中以Log10(FPKM)表示,使用Mev4.9.0(https://sourceforge.net/projects/mev-tm4/)。
CsSCPL-I成员之间的顺式作用元件分布模式有所不同。例如,CsSCPL7-IA和12-IA启动子包含最多的ERE相关元件(五个),而62%的CsSCPL-I基因启动子中未含有ERE元件(补充数据集S2)。值得注意的是,响应ABA的单个基序仅在CsSCPL24-IA启动子中发现。CsSCPL9-IA和22-IA中发现了最多的热休克元件(八个),其次是CsSCPL11-IA中的六个。在CsSCPL13-IA启动子区域中发现了总共六个防御相关元件(补充数据集S2)。在各种处理下,CsSCPL11-IA、13-IA和14-IA在叶片或根中呈差异表达(补充数据集S3)。遮荫导致多种没食子酰化儿茶素(如EGCG和GCG)显著减少(Liu等,2018)。与全光照下的植株相比,遮荫叶片中CsSCPL13-IA、24-IA和14-IA的表达水平明显受到抑制(补充数据集S3)。然而,其他大多数SCPL基因未发生变化,甚至被诱导,例如SCPL11-IA(图4;补充数据集S3)。该结果表明,CsSCPL11、13、14基因最有可能是遮荫下没食子酰化儿茶素减少的原因(Liu等,2018)。此外,MeJA和NaCl处理都促进了叶片或根中EGCG的积累(Shi等,2015;Zhang等,2017)。我们的实验显示,这两种条件都大幅诱导了CsSCPL13-IA和14-IA的表达(图4;补充数据集S3)。这些基因在根中也被PEG和铝暴露所激活(图4),这与之前报道的没食子酰化儿茶素的增加一致(Zhang等,2017)。
CsSCPL基因表达谱
我们首先通过分析八个茶树组织(顶芽、花、果实、嫩叶、成熟叶、老叶、根和茎)的公开RNA-Seq数据,检查了47个CsSCPL基因的表达模式(图5A,补充数据集S3)。大多数基因在几乎所有组织中都有表达,只有少数例外。约25%(12/47)的基因在所有组织中表现出无或极低的表达。这些基因可能由特定条件诱导或正在经历假功能化。此外,CsSCPL2-IA、3-IA、22-IA和23-IA仅在顶芽、嫩叶和茎中表达。另一方面,CsSCPL5-IA、11-IA、13-IA、14-IA和24-IA在所有分析的组织中都表现出高表达(图5A)。对旁系基因对的比较表达分析显示了不同的结果。虽然其中三对表现出非常相似的表达模式,但CsSCPL13-IA/24-IA、22-IA/10-IA和19-IA/1-IA的每个成员显示出不同的表达模式(图5A,补充数据集S3)。这表明每个旁系成员已经或正在经历功能分化。
茶树不同组织中CsSCPL基因的表达模式及qRT-PCR验证 (A) 从公共数据库(茶树信息档案,Welcome to nginx!)获取不同茶树组织中CsSCPL基因的表达水平,并使用TBTools程序构建热图表示。(B) 茶树组织中非没食子酰化和没食子酰化儿茶素含量与CsSCPL-IA基因表达水平的相关性分析。CsSCPL-I的表达数据和多组织实验中的儿茶素含量来自Wei等(2018年)的研究。使用R包进行相关性评估。色条显示Pearson相关系数值。(C–E) 在不同茶树组织(C)以及在铝(Al3+)(D)和MeJA(E)暴露下的CsSCPL-I基因表达分析。分析数据来自至少三个生物重复,结果表示为均值±标准差(SD)。
多组织实验中CsSCPL-I基因表达水平与儿茶素含量之间的Pearson相关性分析(Wei等,2018)表明,大多数CsSCPL-I基因的表达与至少一种儿茶素相关,表明CsSCPL-I基因在儿茶素生物合成中具有冗余功能(图5B)。基于组织特异性表达模式和响应不同胁迫的启动子顺式作用元件的存在,选择五个CsSCPL-I基因进行进一步的qRT-PCR分析,涉及七个组织:CsSCPL2-IA、5-IA、11-IA、13-IA和14-IA(补充数据集S3)。CsSCPL2-IA和11-IA在顶芽和嫩叶中表达相对较高(图5C)。CsSCPL13-IA在所有组织中的表达相对恒定,而CsSCPL14-IA在所有测试的组织中表达非常低。由于启动子分析揭示了几个与MeJA和胁迫相关的顺式作用元件,我们研究了在铝和MeJA暴露下的基因表达情况(图5D–E)。CsSCPL13-IA和14-IA在Al3+处理下显著被诱导,而CsSCPL2-IA、5-IA和11-IA的表达水平仅有较低的检测(图5D)。在MeJA处理12、24和48小时后,CsSCPL2-IA的表达逐渐增加,而CsSCPL11-IA、13-IA和14-IA的表达在24小时内增加,随后减少(图5E)。另一方面,与对照相比,CsSCPL5-IA在暴露于MeJA时表达显著降低。CsSCPL11-IA在MeJA暴露下的表达量达到了最大值。
CsSCPL-I基因的克隆与特征分析
为了在大肠杆菌中生成重组蛋白,上述五个用于表达分析的CsSCPL-I基因被克隆。然而,只有其中的三个基因(CsSCPL11-IA、CsSCPL13-IA和CsSCPL14-IA)在大肠杆菌中成功表达,因此被选用于进一步的功能表征。CsSCPL11-IA、13-IA和14-IA蛋白分别包含450、498和413个氨基酸残基,其计算的分子量分别为51、56和46 kD(补充数据集S1)。它们含有保守的丝氨酸羧肽酶基序(图6A),且通常与其他植物SCPL具有高度相似性。作为IA类的典型例子,CsSCPL17-IA编码区域与AtSAT、AtSST、DkSCPL、VvSCPL18和FvSCPL18具有超过50%的同源性。另一方面,CsSCPL14-IA蛋白序列与AtSAT、AtSST和CsSCPL17-IA的相似性则低于50%(图6A,补充数据集S5)。亲水性分析显示,CsSCPL蛋白在其N-末端附近具有一个强亲水区,表明信号肽的存在。
(A) CsSCPL-I与其他物种中已表征的SCPL的比对。参与关键作用的保守氨基酸残基标注如下:可能形成亚基间二硫键的半胱氨酸残基(红色圆圈),氧阴离子空穴(绿色圆圈),供体分子中芥子酰部分的识别位点(蓝色圆圈),氢键网络(黄色圆圈),主要L-苹果酸识别位点(黑色圆圈),对应于N-糖基化位点的氨基酸序列(蓝色方框),以及组成丝氨酸羧肽酶催化三联体的氨基酸残基(S、D、H)(红色方框)(参见Milkowski和Strack, 2004;Chiu等, 2016)。(B)在大肠杆菌中表达并通过镍树脂部分纯化的带有His标签的CsSCPL11-IA(截短)、13-IA(完整)和14-IA(截短)蛋白融合重组体。通过十二烷基硫酸钠–聚丙烯酰胺凝胶电泳(SDS-PAGE)解析蛋白质,并用考马斯亮蓝R-250染色。
CsSCPL-I蛋白将表儿茶素(EC)和表没食子儿茶素(EGC)转化为其没食子酸形式
在上述五个基因中,在大肠杆菌BL21(DE3)菌株中选择并表达了His标签融合蛋白,只有CsSCPL13-IA和N端50个氨基酸被删除的截短CsSCPL11-IA和14-IA成功表达并通过镍树脂柱纯化。进行这种截短的原因是CsSCPL11-IA和14-IA包含一个N端跨膜结构域(图6B,补充图S2A)。所有成功表达的重组蛋白在pH 6.0时表现出最大活性,使用1,2,3,4,6-五没食子酰葡萄糖(PGG)作为酰基供体,儿茶素(C)、表儿茶素(EC)或没食子儿茶素(GC)作为受体底物。我们还使用PGG作为供体,C、GC、EC或EGC作为受体底物,利用部分纯化的重组酶测定其活性。CsSCPL11-IA、13-IA和14-IA倾向于使用PGG作为没食子酰供体,将EC或EGC分别转化为ECG或EGCG(图7,补充图S3、S4)。利用高效液相色谱(HPLC)结合串联质谱对反应进行分析,并使用标准品确认反应产物(图7A,补充图S3、S4)。
重组CsSCPL11-IA、13-IA和14-IA的活性测定 (A) 使用高效液相色谱(HPLC)验证表儿茶素(EC)、表没食子儿茶素(EGC)和1,2,3,4,6-五-O-没食子酰-β-D-葡萄糖(PGG)的活性测定。 (B) CsSCPL11-IA、13-IA和14-IA活性测定产物的液相色谱-质谱(LC-MS)光谱。ECG:表儿茶素没食子酸酯;EGCG:表没食子儿茶素没食子酸酯。分析数据来自至少三个生物重复。
通过Lineweaver–Burk作图法计算了这三种酶的动力学参数。尽管动力学参数的数值有很大差异,但它们在底物特异性上表现出相同的趋势。CsSCPL13-IA对EC的KM(160.41 μM)和VMax(37.04 μmol mg–1 min–1)均高于其他酶(表1)。与此同时,CsSCPL14-IA在饱和底物浓度下对EGC表现出最大的KM(103.38 μM)和VMax(62.50 μmol mg–1 min–1)(表1)。最大特异性常数(Kcat/KM)在CsSCPL14-IA中观察到,以EC为底物时为5.19 s–1 μM–1,其次是CsSCPL13-IA(3.85 s–1 μM–1)和CsSCPL11-IA(3.14 s–1 μM–1),这意味着CsSCPL14-IA对EC具有更高的结合亲和力。对于EGC也观察到类似的趋势,CsSCPL14-IA的Kcat/KM最大(10.08 s–1 μM–1),其次是CsSCPL13-IA(6.84 s–1 μM–1)和CsSCPL11-IA(5.39 s–1 μM–1)。然而,CsSCPL13-IA对PGG的KM低于其他两种酶。当使用EGC作为受体时,CsSCPL14-IA对PGG的KM(20.81 μM)和VMax(10.64 μmol mg–1 min–1)达到最大值(表1和图8)。CsSCPL14-IA对PGG的Kcat/KM较高,表明EGC是该酶的优选底物。
Acyltransferase kinetics of the recombinant SCPL11-IA, 13-IA, and 14-IA with different substrates.
Substrate | Enzyme | KM (μM) | Vmax (μmol mg–1min–1) | Kcat (s–1) | Kcat/Km (s–1 μM–1) |
---|---|---|---|---|---|
EC | CsSCPL11−IA | 85.39 ± 10.62 | 16.13 ± 2.26 | 268.82 ± 22.76 | 3.14 ± 0.64 |
CsSCPL13−IA | 160.41 ± 21.2 | 37.04 ± 5.25 | 617.28 ± 62.48 | 3.85 ± 0.42 | |
CsSCPL14−IA | 64.28 ± 0.81 | 20.00 ± 4.65 | 333.33 ± 35.25 | 5.19 ± 0.48 | |
EGC | CsSCPL11−IA | 40.67 ± 5.56 | 13.16 ± 1.64 | 219.30 ± 31.74 | 5.39 ± 0.81 |
CsSCPL13−IA | 49.73 ± 8.36 | 20.41 ± 3.95 | 340.14 ± 45.43 | 6.84 ± 0.94 | |
CsSCPL14−IA | 103.38 ± 15.63 | 62.50 ± 5.62 | 1041.67 ± 146.8 | 10.08 ± 1.64 | |
PGG | CsSCPL11−IA | 13.34 ± 1.78 | 4.05 ± 0.62 | 67.48 ± 7.34 | 5.06 ± 0.97 |
CsSCPL13−IA | 10.43 ± 1.25 | 3.67 ± 0.52 | 61.05 ± 8.82 | 5.85 ± 0.84 | |
CsSCPL14−IA | 20.81 ± 3.51 | 10.64 ± 1.44 | 177.31 ± 22.76 | 8.52 ± 1.38 |
利用1,2,3,4,6-五-O-没食子酰-β-D-葡萄糖(PGG)或β-葡萄糖没食子酸酯进行CsSCPL11、13、14重组蛋白催化的EC和EGC没食子酰化的工作模型
讨论
丝氨酸羧肽酶样(SCPL)酰基转移酶的一个大型真双子叶植物家族最初从更古老的丝氨酸羧肽酶家族中招募,并适应于承担酰基转移功能。SCPL酰基转移酶具有由亲核体、酸和组氨酸残基组成的催化三联体,作为对酰胺或酯键进行亲核攻击的电荷传递系统(Milkowski和Strack, 2004)。虽然BAHD酶早已被认为能够酰化花青素和黄烷-3-醇(Zhao, 2015),但催化从1-O-β-葡萄糖酯转酰反应的酶的分子身份及其在各种酚类化合物生物合成中的作用直到20世纪90年代才被描述(Fujiwara等, 1998; Niemetz和Gross, 2005)。丝氨酸羧肽酶(S)催化蛋白质中的C-末端肽键,并形成Ser-Asp-His催化三联体。许多研究表明,SCPL蛋白与α/β水解酶(SCP)家族具有高序列相似性,但它们不具备SCPs的相同水解功能(Milkowski等, 2004)。相反,SCPLs表现出酰基转移酶和裂解酶活性(Li和Steffens, 2000;Shirley等, 2001)。例如,SCPLs的酰基转移酶活性催化形成酰基糖2,3,4-异丁酰基葡萄糖(Lehfeldt等, 2000),而在拟南芥中,酰基转移酶的活性合成芥子酸酯(Fraser等, 2005)。本研究首次在茶树(C. sinensis)中对SCPLs进行了基因组、进化和催化水平的全面分析。
茶树基因组中SCPL基因家族的全基因组分析
SCPL酰基转移酶在许多作物中起关键作用,并在大麦(Baulcombe等, 1987)、水稻(Washio和Ishikawa, 1994)、豌豆(Jones等, 1996)、拟南芥(Li等, 2001)、番茄(Moura等, 2001)、柿子(Ikegami等, 2007)和杨树(Zhu等, 2018)中得到了鉴定和表征。然而,到目前为止,还没有研究系统地分析了茶树中的SCPLs。在这里,我们报告了SCPL家族成员的全基因组鉴定、基因表达分析以及部分成员的酶学检测,以探讨它们的底物特异性,并为其潜在功能提供线索。我们在茶树中发现了47个CsSCPL基因,并将其分为三个主要的系统发育类别。考虑到基因组大小和祖先基因组重复事件,杨树和拟南芥基因组之间的SCPL基因比例预期为2:4(Tang等, 2008)。然而,在这些物种中,SCPL基因在各个系统发育类别中的分布比例为2:1(Zhu等, 2018)。这一结果表明,SCPL基因在拟南芥基因组中发生了丢失。类似地,在我们的研究中,茶树与拟南芥的三个SCPL类别的比例为1:0.7、1:1.3和1:2.5。茶树中CsSCPL-I类的高比例是显著的,暗示了基因组重复事件。旁系同源基因对CsSCPL16-IA/20-IA和12-IA/8-IA的Ks值分别为0.21和0.36(补充表S3),这与发生在3500万年前的杨属谱系重复事件的值(0.27)相似(Guo等, 2014;Wei等, 2018)。与此同时,其他旁系同源基因对的Ks值较低,可能是由近期的串联复制事件产生的(Wei等, 2018)。由于没有发现接近该事件预期Ks值的旁系同源基因对,我们未发现CsSCPL-I旁系同源基因对源自古γ基因组三重化事件的证据(Guo等, 2014)。
我们使用不同的模型进行的选择压力分析显示,SCPL系统发育树每个分支中的多个密码子位点处于正选择状态。大约5%(476个密码子中的26个)在CsSCPL-I基因中处于正选择或纯化选择状态。此外,我们的分析揭示了CsSCPL-I类中的有趣的进化动态。基于Ka/Ks值,许多这些基因处于纯化选择中,表明在基因重复事件后存在强烈的选择压力(补充表S3)。这种观察表明,重复基因的表达模式变化可能在重复后朝着新功能演化。研究认为,现代茶树品种中没食子酰化儿茶素的含量是驯化性状之一(Wei等, 2018)。与现代茶树品种在数千年栽培史、驯化和进化过程中针对较高儿茶素含量,特别是没食子酰化儿茶素的高选择压力一致,SCPL-I而非SCPL-II基因也在进化过程中受到正选择压力的作用(补充图S1)。
在我们的系统发育分析中,不同植物物种基因组中发现的SCPL基因数量在各个类群中有所不同。这一发现表明,不同的研究物种在基因家族演化中表现出保守进化,并在这些谱系中朝多个方向演化。Scaffold2990的两个区域中观察到的基因聚集事件表明,CsSCPL-I类群比其他两个分支进化得更快。同一类群中的外显子/内含子排列相似(Du等, 2012),并且前两个外显子的模态长度保持良好保守,如在葡萄和拟南芥中观察到的那样(Matus等, 2008)。我们的基因系统发育分布分析与之前的报道相一致。然而,一些成员表现出不同的外显子/内含子排列,表明这些SCPL基因可能具有不同的功能。CsSCPL基因含有不超过14个外显子,这与水稻(O. sativa)和拟南芥(A. thaliana)的SCPL基因外显子数量相当。因此,我们得出结论,茶树中的SCPL家族成员在进化过程中维持了其外显子/内含子结构,不同于杨树中发生的情况(Zhu等, 2018)。
有趣的是,一些CsSCPL-I旁系同源基因对在其外显子/内含子结构上存在差异,表明其基因结构发生了分化。此外,CsSCPL基因中发现的保守基序具有相似的特征,表明该家族中的密切进化关系,特别是在同一类群内。旁系同源基因对中发现的相同基序结构表明CsSCPL蛋白潜在功能冗余;另一方面,基序数量的差异暗示了功能变化和分化。基因组重复事件可能导致基因特性的改变,并显著增加功能变化(Liu等, 2014;Ahmad等, 2019)。两对旁系同源基因的Ka/Ks比值显著小于1,表明它们处于强纯化过程,并含有高度保守的氨基酸残基;而剩下的三对旁系同源基因的Ka/Ks比值显著大于1,表明严格的进化限制作用以维持其稳定性。
鉴定和表征可能参与儿茶素没食子酰化的基因
丝氨酸羧肽酶样蛋白参与次生代谢产物的生物合成,为植物提供对生物和非生物胁迫的耐受性(Wilson等,2016)。我们的研究明确表明,大多数CsSCPL1As在酶结构、基因表达模式、调控机制和可能的酶功能方面具有高度相似性。由于全基因组和近期串联基因重复事件的结果,扩展的CsSCPL1A基因在茶树特征次生代谢产物的形成中应发挥关键作用,受到环境和农户对顶芽中更多没食子酰化儿茶素含量的选择压力。虽然很难区分这些CsSCPL基因之间的明显或微妙差异,它们在自然或人工选择下仍在经历趋同或分化进化,我们进一步结合基因表达和儿茶素代谢物相关性分析,来阐明CsSCPL1As的潜在功能差异。发育和环境因素都显著调节儿茶素的生物合成和积累,因此,我们分析了茶树组织在正常或胁迫环境下的基因表达模式与儿茶素积累的关系(图4, 5)。这些数据揭示了它们总体相似但各自不同的作用及其潜在的多样化功能。
我们的序列分析显示,CsSCPL-I基因启动子中存在保守的调控顺式作用元件。它们的模块化组成在不同的CsSCPL-I成员中有所不同,可能协调对光、激素以及生物和非生物胁迫等复杂刺激的响应。转录模式的分析可以为探索基因功能提供线索。CsSCPL基因在不同组织中的表达评估表明了CsSCPL基因在植物中的功能差异。此外,约61%(17/28)的CsSCPL基因在嫩叶中表现出高表达,而57%(16/28)的基因在顶芽中高表达,表明它们在这些器官中发挥作用。我们对选定的CsSCPL基因进行的qRT-PCR分析与分析的公共RNA-Seq数据一致。CsSCPL在Al3+和MeJA暴露下的表达普遍增加,除了CsSCPL11-IA,其表达在MeJA处理下受到抑制(图4)。CsSCPL的转录活性在热胁迫下被诱导,而在冷、盐胁迫和干旱胁迫下则降低(Chiu等,2016)。水稻SCPLs的研究表明,OsBISCPL1在应对多种胁迫中发挥作用(Liu等,2008)。
有研究推测,CsSCPL-I基因参与了嫩叶和顶芽中没食子酰化儿茶素的合成,以防御茶树中的昆虫或病原体(Wei等,2018)。旁系同源基因对CsSCPL9-I/11-IA、CsSCPL15-I/10-IA和CsSCPL19-IA/1-IA的每个成员表现出不同的表达模式和基因结构,暗示它们可能正在经历功能分化。另一方面,CsSCPL27-IA/24-IA和CsSCPL14-IA/24-IA除了序列相似性外,还表现出非常相似的表达模式和基因结构,强烈表明功能冗余。CsSCPL2-IA和CsSCPL11-IA在MeJA处理下显著诱导。因此,这些基因可能是研究在抗病机制中发挥作用的有趣候选基因。
没食子酰化儿茶素的生物合成是基于非没食子酰化儿茶素C环上3位的没食子酰基转酰化反应。转酰化反应是通过植物中的活化供体分子完成的。BAHD家族中的辅酶A硫酯和SCPL中的1-O-葡萄糖酯作为活化供体是由于它们具有高水解自由能(Fraser等,2007)。在1-O-葡萄糖没食子酯中,PGG或其水解产物(如二、三、四和单没食子酰葡萄糖,如β-葡萄糖没食子酸酯)可以作为没食子酰供体,用于修饰EC或EGC以分别形成ECG或EGCG。茶树叶产生许多多没食子酰化葡萄糖衍生物(Yang和Tomás-Barberán,2018;Wei等,2019)。β-葡萄糖没食子酸酯由茶树中的UDP-葡萄糖和没食子酸通过UDP-葡萄糖:没食子酰-1-O-β-D-葡萄糖基转移酶CsUGT84A22生成(Liu等,2012),其同源物也在其他几种植物中报道(Ono等,2016;Tahara等,2018;Zhao等,2020)。β-葡萄糖没食子酸酯进一步用作没食子酰供体,在1,6-二-O-没食子酰-β-D-葡萄糖的连续没食子酰化过程中生成1,2,6-三-O-、1,2,3,6-四-O-、和1,2,3,4,6-五-O-没食子酰-β-D-葡萄糖(Niemetz和Gross,2005)。在没食子单宁的生物合成中,还检测到1,6-二-O-没食子酰-葡萄糖:1,6-二-O-没食子酰葡萄糖2-O-没食子酰转移酶活性,这表明1,6-二-O-没食子酰-葡萄糖也可作为酰基供体(Niemetz和Gross,2005)。
另一方面,包括PGG(五没食子酰葡萄糖)和EGCG在内的可水解单宁可以通过酶促水解产生一系列没食子酰葡萄糖衍生物,如二、三、四和单没食子酰葡萄糖,以及没食子酸和儿茶素(Jana等,2014;Dai等,2020;Zhao等,2020)。事实上,我们的实验显示,空载体对照表现出PGG的显著水解(图7)。这解释了为什么茶树叶中的EGCG和PGG不稳定,或许也解释了为什么PGG可作为酰基供体。茶树叶累积了高水平的二、三、四和单没食子酰葡萄糖(Yang和Tomás-Barberán,2018;Wei等,2019)。
微生物,如细菌和植物病原菌,具有特别活跃的单宁酶或可水解单宁水解酶,以克服植物的化学防御并利用植物提供的能量(Jana等,2014)。因此,本研究中部分纯化的酶提取物可能含有一些细菌的单宁酶活性蛋白,可以触发PGG水解为各种没食子酰葡萄糖,这些葡萄糖可作为儿茶素没食子酰化的合适酰基供体,这种情况也可能发生在茶树中。尽管如此,我们的工作是第一个展示通过茶树CsSCPLs催化的酶促检测来合成没食子酰化儿茶素的研究。之前,已经进行过两步酶反应,包括茶树中UGGT和另一种涉及ECGT的反应,并使用β-葡萄糖没食子酸酯作为转酰反应的供体分子(Liu等,2012),但编码该酶的基因尚未被鉴定。
CsSCPL酶是疏水性糖蛋白,其活性位点中涉及多个丝氨酸残基,而不是金属离子。只有少数研究(如在柿子和葡萄中进行的研究,Ikegami等,2007;Terrier等,2009)在遗传水平上研究了SCPL酰基转移酶,后者很可能参与没食子酰化儿茶素的生物合成。然而,它们的酶功能尚未得到验证,与儿茶素没食子酰化的相关性只是推测。从茶树基因组中选择了五个聚集到CsSCPL-I类并能够催化葡萄糖酯形成的候选基因,通过酶活性测定对它们的功能进行了评估。其中,三个基因在大肠杆菌中成功表达,并显示出对EGC比EC更高的结合亲和力。我们研究中观察到的催化特性与Liu等(2012年)报告的结果之间的差异可能是由于反应使用的底物或酶来源的不同,因为该研究使用植物提取物,而我们使用纯化的重组酶。
三种SCPL-IA酶参与没食子酰化儿茶素的生物合成
茶树基因组序列的可用性使得可以鉴定SCPL酰基转移酶基因家族的IA亚类,后者可能参与叶片中单体没食子酰化儿茶素的合成(Wei等,2018)。与其他植物群中主要存在的不溶性聚合原花青素(PAs或缩合单宁)不同,茶树叶主要累积可溶性单体儿茶素(如C、GC、EC、EGC)及其没食子酰化衍生物(CG、ECG、GCG、EGCG)(Wei等,2015)。这些分子占叶片中总儿茶素的75%,对茶叶品质具有重大影响。然而,没食子酰化儿茶素生物合成的遗传基础尚不完全清楚,这目前是茶生物学中的一个基本生物学问题(Zhao等,2020)。生化研究表明,通过1-O-葡萄糖酯依赖性反应合成黄烷-3-醇是由没食子酰-1-O-β-D-葡萄糖基转移酶(UGGT)和表儿茶素:1-O-没食子酰-β-D-葡萄糖O-没食子酰转移酶(ECGT)催化的(Liu等,2012)。类似的反应在其他植物物种中也发现,如葡萄和柿子(Ikegami等,2007;Terrier等,2009;Wilson等,2016)。到目前为止,在茶树基因组中冗余存在的至少22个CsSCPL-I基因中,没有任何关于涉及茶树中没食子酰化儿茶素生物合成的基因的分子证据被发表(Wei等,2018)。我们的综合分析暗示,这些CsSCPL-I基因可能具有重叠但差异化的功能。由于存在多样且复杂的可水解单宁,包括各种O-葡萄糖没食子酯和没食子酰化儿茶素,CsSCPL-I酰基转移酶可能具有类似但差异化的酶功能。
我们鉴定和表征了三种SCPL-IA基因,其表达水平与EGCG和ECG的积累高度相关,因为它们在顶芽和嫩叶中具有高转录活性,这些部位是大多数没食子酰化黄烷-3-醇积累的地方(图5B)。我们进一步通过酶促实验确认,重组酶能够在体外催化没食子酰化儿茶素的生成(表1和图8)。最近的一项研究表明,没食子酰化儿茶素(如EGCGs)主要储存在中央液泡中(Xu等,2016)。一致的是,我们的分析表明,CsSCPL11和CsSCPL13被预测定位于溶酶体,包括液泡(补充数据集S1)。考虑到这些SCPLs在体外的酶活性相对较低,而茶树叶中没食子酰化儿茶素积累为主要形式,这一结果可以通过多种原因来解释。首先,使用了PGG而不是β-葡萄糖没食子酸酯作为酰基供体(图8)。虽然已经显示PGG可以有效地水解成不同的没食子酰葡萄糖,包括β-葡萄糖没食子酸酯,但酶效率较低。其次,在细胞中可能需要蛋白质修饰(如糖基化、磷酸化)或分子相互作用(如同二聚化、异二聚化、变构调控)来增强酶活性。这是关于CsSCPL-I基因在没食子酰化儿茶素生物合成中发挥作用的首次报道。尽管如此,我们的结果证明了SCPLs参与了EC或EGC没食子酰化的假设,因为研究的所有三种酶都倾向于将EC或EGC转化为它们的没食子酰化形式。对这些方面的进一步研究对于深化我们对SCPL酶在植物生理学中所起作用的理解至关重要。
结论
我们证明了CsSCPL1A基因在茶树基因组中的趋同和分化进化,以及它们在不同茶树组织中普遍相似但又存在差异的基因表达模式,受到发育和环境因素的影响,并且CsSCPL11-IA、13-IA和14-IA是SCPL酰基转移酶,在EC或EGC的没食子酰化中具有相似的酶动力学。我们对茶树中SCPL基因家族的全基因组分析,以及三种重组CsSCPLs的生化表征,如底物特异性和酶动力学参数,揭示了理解这些化合物在茶树中所起生理作用的重要结果。研究中功能表征的三种CsSCPL基因在植物不同组织和对非生物胁迫及激素的响应中表现出不同的表达模式。本研究提供的见解不仅有助于理解这些没食子酰化代谢物的生物合成时机和位置,还帮助揭示ECG或EGCG在茶树中发挥的生理作用。