摘要
三萜皂苷(triterpenoids saponins)是由三萜皂苷元和一个或多个糖基和/或其他化学基团缩合而成的一系列结构多样的天然化合物[1], 主要分布在五加科、蝶形花科、石竹科、桔梗科、毛茛科、玄参科、葫芦科等植物中[2]. 植物中三萜皂苷常分布在特定的器官和组织, 如人参(Panax ginseng)、桔梗(Platycodon grandiflorus)的根, 麦蓝菜(Vaccaria hispanica)的种子, 罗汉果(Siraitia grosvenori)的果实和积雪草(Centella asiatica)的茎、叶等部位均积累着丰富的三萜皂苷. 三萜皂苷元的骨架由30个碳原子构成, 常见的为四环三萜和五环三萜, 其中最常见的三萜母核类型为达玛烷型(dammarane)和齐墩果烷型(oleanane). 三萜皂苷不仅参与植物的通讯、防御和感觉调控, 还具有抗炎、抗癌、抗菌、抗病毒等多种生物活性[3,4]. 甘草(Glycyrrhiza uralensis)中的甘草酸、罗汉果中的罗汉果苷的甜味分别约为蔗糖的941倍和300倍[5,6], 可用作天然甜味剂. 此外, 三萜皂苷是一种两亲性化合物, 在水中可以形成稳定的泡沫[7], 常被用于制作清洁剂、发泡剂和乳化剂等. 三萜皂苷的这些特性, 使其在医药、食品、日化、农业等领域受到了广泛关注, 这均得利于三萜皂苷的结构多样性. 然而, 由于三萜皂苷结构复杂、含量低, 使得直接提取、分离, 或通过化学合成等方法间接获取三萜皂苷都相对困难, 限制了其广泛应用[8]. 利用生物技术对三萜皂苷生物合成途径进行研究, 从而提高目标代谢产物的含量, 或利用合成生物学方法生产三萜皂苷, 已成为当前研究热点. 现今在三萜皂苷生物合成途径解析、转录调控机制及微生物细胞工程方面取得了一定进展, 进一步阐明三萜皂苷生物合成的分子机制, 将有助于实现其在植物或微生物中的人工调控, 以提高产量. 因此, 本文总结了三萜皂苷生物合成途径研究中的新技术、新方法, 综述了三萜皂苷生物合成途径、关键酶基因、转录调控以及三萜皂苷微生物细胞工程方面的最新进展, 并对今后的发展方向进行了展望, 以期为相关领域的研究提供参考.
1 三萜皂苷生物合成途径中的新技术和新方法
近年来, 随着高通量测序技术的发展, 许多植物的基因组和转录组信息被在线解码和发布, 为植物三萜皂苷合成途径的解析提供了许多有价值的信息. 多组学关联分析或利用大数据发掘三萜皂苷生物合成相关基因已成为当前研究的热点. 研究人员已通过转录组学分析对多种植物的三萜皂苷合成途径进行了初步探究, 如甘草[9]、人参[10]、罗汉果[11]、岗梅(Ilex asprella)[12]、刺五加(Eleutherococcus senticosus)[13]、桔梗[14]、毛冬青(Ilex pubescens)[15]、皂荚(Gleditsia sinensis)[16]和细风轮菜(Clinopodium gracile)[17]等, 这些研究丰富了三萜皂苷生物合成关键元件的基因库资源. Zhang等人[18]采用靶向代谢组学和转录组学关联分析对远志(Polygala tenuifolia)中的三萜皂苷生物合成相关基因进行了初步筛选. Zhan等人[19]以鹅掌草(Anemone flaccida)为材料, 对其进行转录组学和蛋白组学数据关联分析, 发现了与三萜皂苷生物合成相关的126个CYP450s(cytochrome P450-dependent monooxygenases)和32个UGTs(uridine diphosphate (UDP)-glucosyltransferases)基因. 中国农业科学院蔬菜花卉研究所黄三文课题组[20]开展了黄瓜(Cucumis sativus)全基因组关联分析, 发现了调控葫芦素(cucurbitacin)合成途径的转录因子(Bl, Bt)和相关的基因簇. Yan等人[21]对美国国立生物技术信息中心(National Center for Biotechnology Information, NCBI)数据库中的9个人参属EST(Expressed Sequence Tag)文库数据进行组装和数据分析, 筛选出16条UGTs序列进行实验验证, 获得了催化人参皂苷合成的第一个糖基转移酶UGTPg1. 多组学、大数据及合成生物学的联合使用为三萜皂苷代谢途径的解析提供了新的突破口(图1), 整合基因共表达分析、基因簇鉴定等方法鉴定三萜皂苷生物合成结构基因、转录因子等, 同时利用酵母表达系统和高效的烟草瞬时表达体系等进行功能分析[22]. 新途径和新基因的发掘不仅有助于三萜皂苷在底盘植物或微生物中高效合成, 还能为分子设计育种等方面的研究奠定基础.
2 植物三萜皂苷生物合成途径
2.1 三萜皂苷生物合成途径
植物中的三萜均来自异戊烯基焦磷酸(isopentenyl pyrophosphate, IPP, C5)和二甲基烯丙基焦磷酸(dimethylallyl pyrophosphate, DMAPP, C5). IPP和DMAPP可以由两条不同的途径合成: 细胞质中的甲羟戊酸(mevalonate, MVA)途径和质体中的2-C-甲基-D-赤藓醇-4-磷酸(2-C-methl-D-erythritol-4-phospate, MEP)途径. MVA途径以乙酰辅酶A(acetyl-CoA)为起始底物, 经过六步缩合反应生成IPP; MEP途径则是以丙酮酸和甘油醛3-磷酸为起始底物, 经过七步反应合成IPP[5](图2B). 其中, MVA途径在三萜皂苷的生物合成中起到主导作用[1,3,5,23]. IPP和DMAPP在香叶基焦磷酸合成酶(geranylpyrophosphate synthetase, GPS)的作用下经过缩合生成香叶基焦磷酸(geranylpyrophosphate, GPP, C10); GPP在法呢基焦磷酸合酶(farnesyl pyrophosphate synthetase, FPS)的催化下再加入第二个IPP单元生成法呢基焦磷酸(farnesyl pyrophosphate, FPP, C15); 然后两个FPP经鲨烯合成酶(squalene synthase, SS)缩合形成角鲨烯(squalene, C30), 随后在鲨烯氧化酶(squalene epoxidase)的作用下环氧化生成2,3-氧化鲨烯(2,3-oxidosqualene, C30)[5](图2B). 2,3-氧化鲨烯经环化、羟基化、糖基化等结构修饰可以合成各种三萜皂苷, 介导这些反应的酶有氧化鲨烯环化酶(OSCs)、细胞色素P450(CYP450s)和糖基转移酶(UGTs)等(图2A).
2.2 三萜皂苷生物合成中的关键酶
植物三萜皂苷种类繁多、结构复杂, 虽然它们有着共同的前体合成途径, 但后修饰具有高度特异性和多样性, 而且相关元件的编码基因分布在整个基因组中, 以网状途径作用产生化合物阵列而非单一化合物, 这大大增加了解析三萜皂苷生物合成途径的难度[1,3]. 植物中三萜皂苷的积累具有器官和组织特异性, 而且生物或非生物胁迫均可诱导植物三萜皂苷的合成. 三萜皂苷生物合成途径包含了20余步连续的酶促反应, 其中从乙酰辅酶A到2,3-氧化鲨烯的上、中游代谢途径已研究得比较清晰(图2B), 该过程中研究得比较多的酶有3-羟基-3-甲基戊二酰辅酶A还原酶(HMGR, EC1.1.1.34)、法呢基焦磷酸合酶(FPS, EC2.5.1.1/EC2.5.1.10)、鲨烯合成酶(SS, EC2.5.1.21)、鲨烯环氧酶(SE, EC1.14.99.7), 这些酶在植物中均以基因家族的形式存在. HMGR是植物MVA途径的第一个限速酶[24]; FPS, SS和SE均处在三萜皂苷合成途径的分支点上[25]. 目前, 仅有少数几种参与三萜皂苷生物合成的HMGR, FPS, SS和SE基因被克隆和鉴定(表1).
Overview of HMGR, FPS, SS, and SE related to triterpenoid saponin biosynthesis reported in literaturesa)
关键酶 | 基因 | GenBank登记号 | 植物来源 | 功能分析方法 | 参考文献 |
HMGR | PgHMGR1 | KM386694 | 人参 | 拟南芥突变体/人参(超表达) | [26] |
PnHMGR | KJ578757 | 三七 | 三七细胞株系(超表达) | [27] | |
HMGR | JN377411 | 灵芝 | 灵芝(超表达) | [28] | |
FPS | PgFPS | DQ087959 | 人参 | 大肠杆菌/积雪草/人参毛状根(超表达) | [29] |
SS | PgSS1 | AB115496 | 人参 | 刺五加合子胚愈伤组织 | [30] |
GuSQS1 | AM182329 | 甘草 | 甘草毛状根 | [31] | |
PnSS | KC953033 | 三七 | 三七细胞株系(超表达) | [27] | |
SE | NSSQE1 | FJ232947 | 黑种草 | 酵母 | [32] |
PgSQE1 | AB122078 | 人参 | 人参(RNAi) | [33] | |
CpSE2 | – | 西葫芦 | 酵母/烟草/西葫芦毛状根 | [34] |
然而, 三萜皂苷生物合成下游代谢通路从2,3-氧化鲨烯到最后的三萜皂苷形成在不同植物中都有各自的规律(图2A), 接下来本文将对后修饰过程中涉及的OSCs, CYP450s和UGTs这三大酶类进行具体阐述.
(1) 氧化鲨烯环化酶.
氧化鲨烯环化酶(oxidosqualene cyclase, OSCs, EC5.4.99.x)是三萜皂苷下游合成阶段的第一个限速酶, 也是三萜皂苷和甾醇生物合成途径的分支点, 引导2,3-氧化鲨烯经质子化、环化、重排和去质子化等完成环化过程生成三萜骨架[7]. 该酶形成了一个超基因家族, 家族成员氨基酸同源性较高, 含有DDTAEA序列(参与底物结合)和QW特征序列(与蛋白质结构稳定性相关)这两个高度保守序列[35]. 理论上, 2,3-氧化鲨烯环化能形成100余种三萜骨架, 其结构多样性可能与相关酶的灵活多变核心部位有关, OSC上一个氨基酸序列的改变都可能导致产物发生改变[7,36~38]. 然而, 迄今发现的OSCs产物仅有数十种. 在不同OSCs的作用下, 2,3-氧化鲨烯通过“椅-船-椅”式构象变化, 可以转化为protosteryl阳离子, 导致羊毛甾醇(lanosterol)、环阿屯醇(cycloartenol)、葫芦二烯醇(cucurbitadienol)、帕克醇(parkeol)等物质的形成(图2A), 这些物质又可以进一步衍生为植物甾醇、甾体糖苷生物碱、甾体皂苷等; 然而, 羊毛甾醇、环阿屯醇、葫芦二烯醇等物质在植物中也可以作为三萜的前体[38,39], 在相应酶的催化作用下分别衍生成羊毛脂烷型(lanostane)、环阿屯烷型(cycloartane)和葫芦烷型(cucurbitane)四环三萜皂苷, 如灵芝酸C(ganoderic acid C)、黄芪苷IV(asteagalosid IV)、罗汉果苷IE(mogroside IE)等. 2,3-氧化鲨烯通过“椅-椅-椅”式构象变化, 则导致了各种三萜皂苷苷元的形成, 该过程中的第一个中间产物是dammarenyl阳离子, dammarenyl阳离子可以直接生成达玛烯二醇(dammarenediol-II); 同时, dammarenyl阳离子可以进一步被转化为tirucallanyl阳离子(生成甘遂烷型皂苷元, tirucallane)或baccharenyl阳离子; baccharenyl阳离子又能被转化为五环的lupanyl阳离子, 从而形成羽扇豆醇(lupeol); lupanyl阳离子的五元环E环重新打开、扩展成六元环的过程中, 产生了中间环化产物germanicyl阳离子, 该阳离子能进一步生成oleanyl阳离子(生成β-amyrin)和ursanyl阳离子(生成α-amyrin)(图2A)[3,7]. 介导这些反应的酶主要有达玛烯二醇合成酶(dammarenediol-II synthase, DS)、羽扇豆醇合成酶(lupeol synthase, LuS)、α-香树素合成酶(α-amyrin synthase, αAS)和β-香树素合成酶(β-amyrin synthase, βAS)等, 分别催化2,3-氧化鲨烯形成达玛烷型、甘遂烷型等四环三萜骨架和齐墩果烷型、乌苏烷型(ursane)、羽扇豆烷型(lupine)等五环三萜类骨架, 这些三萜骨架经过进一步修饰可以生成人参皂苷Rh2(ginsenoside Rh2)、flindissone、甘草甜素(glycyrrhinzin)、28-葡萄糖基-积雪草酸(28-Glc-asiatic acid)、桦木酸(betulinic acid)等三萜皂苷元或皂苷. 此外, Xue等人[40]在籼稻(Oryza sativa Japonica)中发现了一种新的多功能OsOSC7(GenBank accession number: ABG22399), 该酶可以使2,3-氧化鲨烯通过“椅-半椅-椅”式构象变化转化为一种新的阳离子orysatinyl, 然后进一步生成一种新的五环三萜籼稻醇(orysatinol)(图2A).
研究人员已经从多种植物中克隆得到85条与三萜皂苷生物合成相关的OSCs基因, 并且在酵母、同源或异源植物宿主中进行了功能分析(表2). 进化树分析结果表明, “椅-半椅-椅”式构象变化在系统发育树上介于“椅-船-椅”式构象变化和“椅-椅-椅”式构象变化之间, 常见的不同功能的OSCs(如CS, LuS, DS, βAS和αAS等)分别聚集在发育树的不同分枝上(图3), 可见具有相同功能的OSC序列相似性较高.
Table 2 Overview of OSCs related to triterpenoid saponin biosynthesis reported in literaturesa)
类别 | 基因 | GenBank登记号 | 植物来源 | 产物 | 功能分析方法 | 参考文献 | ||||||
DS | PNA | AB265170 | 人参 | dammarenediol-II | 酵母 | [41] | ||||||
DDS | AB122080 | 人参 | dammarenediol-II | 酵母/人参(RNAi) | [42] | |||||||
CaDDS | AY520818 | 积雪草 | dammarenediol-II | 酵母 | [43] | |||||||
PgDDS | AB122080 | 人参 | dammarenediol-II | 烟草 | [44] | |||||||
PnDS | KC422652 | 三七 | dammarenediol-II | 酵母 | [45] | |||||||
PqDS | KC316048 | 西洋参 | dammarenediol-II | 酵母 | [46] | |||||||
LuS | OeOEW | AB025343 | 油橄榄 | lupeol | 酵母 | [47] | ||||||
ToTRW | AB025345 | 蒲公英 | lupeol | 酵母 | [47] | |||||||
BPW | AB055511 | 白桦 | lupeol | 酵母 | [48] | |||||||
GgLUS1 | AB116228 | 光果甘草 | lupeol | 酵母 | [49] | |||||||
OSC3 | AB181245 | 百脉根 | lupeol | 酵母 | [50] | |||||||
RcLUS | DQ268869 | 蓖麻 | lupeol | 酵母 | [51] | |||||||
BgLUS | AB289586 | 木榄 | lupeol | 酵母 | [52] | |||||||
WsOCS/LS | JQ728552 | 南非醉茄 | lupeol | 酵母 | [53] | |||||||
LUP2 | KP784688 | 欧洲山芥 | lupeol | 酵母/烟草 | [54] | |||||||
LsOSC1 | MG708182 | 大花紫薇 | lupeol | 酵母/烟草 | [55] | |||||||
TaOSC4 | MK547514 | 阿江榄仁 | lupeol | 酵母 | [56] | |||||||
ItOSC6 | – | 鸢尾 | lupeol | 酵母 | [57] | |||||||
αAS | PSM | AB034803 | 豌豆 | α-amyrin/β-amyrin | 酵母 | [58] | ||||||
IaAS3079 | – | 岗梅 | α-amyrin/β-amyrin | 酵母 | [59,60] | |||||||
IaAS481 | – | 岗梅 | α-amyrin/β-amyrin | 酵母 | [59,60] | |||||||
BvLUP5G | KP784690 | 欧洲山芥 | α-amyrin/β-amyrin | 酵母/烟草 | [54] | |||||||
LsOSC2 | MG708183 | 大花紫薇 | α-amyrin/β-amyrin | 酵母/烟草 | [55] | |||||||
TaOSC2 | MK547512 | 阿江榄仁 | α-amyrin/β-amyrin | 酵母 | [56] | |||||||
CrAS | JN991165 | 长春花 | α-amyrin/β-amyrin | 酵母 | [61] | |||||||
EjAS | JX173279 | 枇杷 | α-amyrin/β-amyrin | 酵母 | [62] | |||||||
ObAS2 | JQ809437 | 罗勒 | α-amyrin/β-amyrin | 酵母 | [63] | |||||||
OSC9 | LC485316 | 百脉根 | α-amyrin | 酵母 | [64] | |||||||
ItOSC2 | – | 鸢尾 | α-amyrin/β-amyrin/δ-amyrin | 酵母 | [57] | |||||||
βAS | PNY1 | AB009030 | 人参 | β-amyrin | 酵母 | [65] | ||||||
PNY2 | AB014057 | 人参 | β-amyrin | 酵母 | [65] | |||||||
PSY | AB034802 | 豌豆 | β-amyrin | 酵母 | [58] | |||||||
GgbAS1 | AB037203 | 光果甘草 | β-amyrin | 酵母 | [66] | |||||||
AsbAS1 | AJ311789 | 燕麦 | β-amyrin | 酵母 | [67] | |||||||
BPY | AB055512 | 白桦 | β-amyrin | 酵母 | [48] | |||||||
MtAMY1 | AF78453 | 蒺藜苜蓿 | β-amyrin | 酵母 | [68] | |||||||
EtAS | AB206469 | 绿玉树 | β-amyrin | 酵母 | [69] | |||||||
LjAMY1/cOSC1 | AB181244 | 百脉根 | β-amyrin | 酵母 | [50] | |||||||
βAS | BgbAS | AB289585 | 木榄 | β-amyrin | 酵母 | [52] | ||||||
VhBS | DQ915167 | 麦蓝菜 | β-amyrin | 酵母 | [70] | |||||||
NsbAS1 | FJ013228 | 黑种草 | β-amyrin | 酵母 | [71] | |||||||
AtBAS | AB374428 | 拟南芥 | β-amyrin | 酵母 | [72] | |||||||
β-AS | HM219225 | 辽东楤木 | β-amyrin | 大肠杆菌/酵母 | [73] | |||||||
SlTTS1 | HQ266579 | 番茄 | β-amyrin | 酵母/番茄(超表达) | [74] | |||||||
ObAS1 | KF636411 | 罗勒 | β-amyrin | 酵母 | [63] | |||||||
MlbAS | KF425519 | 非洲灌木 | β-amyrin | 酵母/非洲灌木(RNAi) | [75] | |||||||
KsBAS | KT150523 | 刺楸 | β-amyrin | 酵母 | [76] | |||||||
EsBAS | KX378998 | 刺五加 | β-amyrin | 酵母/烟草 | [77] | |||||||
LsOSC3 | MG708184 | 大花紫薇 | β-amyrin | 酵母/烟草 | [55] | |||||||
LsOSC4 | MG708185 | 大花紫薇 | β-amyrin | 酵母/烟草 | [55] | |||||||
TaOSC1 | MK547511 | 阿江榄仁 | β-amyrin | 酵母 | [56] | |||||||
CqbAS1 | KX343074 | 藜麦 | β-amyrin | 酵母 | [78] | |||||||
CS | CPQ | AB116238 | 西葫芦 | cucurbitadienol | 酵母 | [79] | ||||||
CsBi/CsCPQ | KM655855 | 黄瓜 | cucurbitadienol | 酵母 | [20] | |||||||
CcCDS2 | KM821405 | 药西瓜 | cucurbitadienol | 酵母 | [80] | |||||||
SgCBQ | HQ128567 | 罗汉果 | cucurbitadienol | 酵母 | [81] | |||||||
CmBi/CmCPQ | XM_008461716 | 香瓜 | cucurbitadienol | 酵母 | [82] | |||||||
多功能OSC | BvLUP5P | KP784689 | 欧洲山芥 | α-amyrin/β-amyrin/lupeol | 酵母/烟草 | [54] | ||||||
KcMS | AB257507 | 秋茄 | α-amyrin/β-amyrin/lupeol | 酵母 | [83] | |||||||
MdOSC1 | FJ032006 | 苹果 | α-amyrin/β-amyrin/lupeol | 酵母 | [62,84,85] | |||||||
MdOSC3 | FJ032008 | 苹果 | α-amyrin/β-amyrin/lupeol | 酵母/烟草 | [84,85] | |||||||
BfOSC1 | LC464978 | 紫荆 | α-amyrin/β-amyrin/lupeol | 酵母/烟草 | [86] | |||||||
AtLUP2 | NM_106545 | 拟南芥 | tirucalla-7,24-dien-3β-ol/α-amyrin/β-amyrin/lupeol/taraxasterol/ψ-taraxasterol/bauerenol | 酵母 | [87] | |||||||
CsOSC2 | AB058508 | 闭鞘姜 | β-amyrin/lupeol/germanicol | 酵母 | [88] | |||||||
LjAMY2 | AF478455 | 百脉根 | lupeol/β-amyrin/20-hydroxylupeol | 酵母/烟草/百脉根(毛状根) | [89] | |||||||
RsM1 | AB263203 | 木榄 | germanicol/β-amyrin/lupeol | 酵母 | [52] | |||||||
RsM2 | AB263204 | 木榄 | taraxerol/β-amyrin/lupeol | 酵母 | [52] | |||||||
MdOSC4 | KT383435 | 苹果 | β-amyrin/lupeol/germanicol | 酵母/烟草 | [84] | |||||||
MdOSC5 | KT383436 | 苹果 | β-amyrin/lupeol | 酵母/烟草 | [84] | |||||||
SlTTS2 | HQ266580 | 番茄 | α-amyrin/β-amyrin/taraxasterol/δ-amyrin | 酵母/番茄(超表达) | [74] | |||||||
BfOSC2 | LC464979 | 紫荆 | β-amyrin/lupeol/germanicol | 酵母/烟草 | [86] | |||||||
AtBARS1 | NM_117625 | 拟南芥 | baruol/β-amyrin | 酵母 | [90] | |||||||
AtCAMS1 | NM_148667 | 拟南芥 | β-amyrin/camelliol C/achilleol A | 酵母 | [91] | |||||||
AtLUP1 | U49919 | 拟南芥 | β-amyrin/lupeol | 酵母 | [92] | |||||||
多功能OSC | AtMRN1 | NM_123624 | 拟南芥 | marneral/marnerol/camelliol C/achilleol A/δ8-polypodatetraenol | 酵母 | [93] | ||||||
AtTHAS1 | NM_124175 | 拟南芥 | thalianol, thalianol-21,22-epoxide | 酵母 | [94] | |||||||
AtPEN1 | NM_117622 | 拟南芥 | arabidiol, arabidiol-20,21-epoxide | 酵母 | [93] | |||||||
OsOSC6 | KC416147 | 水稻 | α-amyrin/β-amyrin | 酵母/水稻 | [95] | |||||||
OsOSC7 | ABG22399 | 水稻 | orysatinol/orysaspirol | 酵母 | [40] | |||||||
OsPS/OsOSC7 | AK066327 | 水稻 | parkeol | 酵母 | [96] | |||||||
OsOSC8 | AK070534 | 水稻 | achilleol B/tirucalla-7,24-dien-3β-ol/α-amyrin/β-amyrin/ψ-taraxasterol/butyrospermol/dammara-20,24-dien-3β-ol | 酵母 | [96,97] | |||||||
其他 | OsOSC10 | – | 水稻 | friedelin | 酵母 | [97] | ||||||
OsIAS/OsOSC11 | AK067451 | 水稻 | isoarborinol | 酵母/拟南芥(超表达) | [39] | |||||||
OsOSC12/OsPTS1 | – | 水稻 | poaceatapetol | 酵母/水稻 | [98] | |||||||
AtLAS1 | NM_114382 | 拟南芥 | lanosterol | 酵母 | [99] |
(2) 细胞色素P450.
细胞色素P450依赖性单加氧酶(CYP450s, EC1.14.x.x)是三萜皂苷生物合成途径中的关键酶, 催化三萜骨架进行羟基化、羧基化、醛基化、酮基化和脱氢脱水等结构修饰, 形成三萜皂苷的中间体[1,3,100]. 典型的CYP450s具有A、B、C、D四个特征性结构域, 其中结构域A上的(A/G)GX(D/E)T(T/S)序列是底物和氧分子连接的部位, 结构域D上的PFG(A/S/V)GRRXC(P/A/V)G序列是铁血红素通过共价键连接的部位.
CYP450s约占植物基因组蛋白编码基因的1%, 是参与植物代谢的酶中最大的家族[101]. 根据氨基酸序列同源性和系统发育标准, 将同源性>40%和>55%的CYP450s分别归为同一家族和亚家族. CYP450s的命名规则为: CYP及其后面的数字、字母分别表示细胞色素P450、家族、亚家族和同工酶, v1、v2表示等位基因, P代表假基因. 已知植物中有127个CYP450家族, 其中陆生植物CYP450s被进一步划分为11个家系[101], 参与植物三萜皂苷生物合成的CYP450s主要来自CYP51, CYP71, CYP72和CYP85家系[102]. CYP85家系中的CYP716家族酶被认为是双子叶植物三萜生物合成多样性的主要贡献者, 其亚家族CYP716A/-C/-E/-Y成员主要参与双子叶植物中五环三萜骨架的氧化; 而来自CYP51家系中的CYP51H亚家族负责单子叶植物中五环三萜骨架的修饰[101,103,104]. CYP71家系中的CYP93E、CYP72家系中的CYP72A和CYP85家系中的CYP88D亚家族成员与豆科植物中三萜骨架的氧化密切相关[105]. 此外, CYP71家系(成员: CYP705A, CYP71A, CYP71D, CYP81Q)和CYP85家系(成员: CYP87D, CYP88L, CYP708A, CYP716U, CYP716S)也参与了三萜皂苷的生物合成[104].
CYP450s数量庞大、底物特异性强、序列相似度低, 而且表达的产物物理性质十分相似难以分开, 这大大加深了解析其生物转化步骤的难度[106]. 目前, 仅有73个参与三萜皂苷生物合成的CYP450s被成功鉴定(表3). 通过对这些CYP450s基因的系统发育分析, 发现不同家系、家族的CYP450s在发育树上被明显的区分(图4), 不同家系中的CYP450s多数具有相似功能. 例如, 在这73个CYP450s中, 大约有30个CYP716A家族成员具有C-28氧化酶活性, 它们中大多数催化α-amyrin/β-amyrin/lupeol骨架C-28位连续三步氧化形成羟基、醛和羧基[106,118,120,124]. 而CYP716E和CYP716S家族成员分别催化三萜C-6、C-2α羟基化, CYP93E家族主要在C-24位催化三萜氧化. 此外, CYP450s还具有催化三萜骨架C-3, C-11, C-12, C-16, C-19, C-20, C-21, C-22, C-23, C-25, C-30等位置氧化的作用.
Table 3 Overview of CYP450s related to triterpenoid saponin biosynthesis reported in literaturesa)
编号 | 基因 | GenBank登录号 | 植物来源 | 底物 | 反应 | 产物 | 功能分析方法 | 参考文献 |
1 | CYP51H10 | DQ680852 | 燕麦 | β-amyrin | C12,C13β环氧化/C16β羟基化 | 12,13β-epoxy-16β-hydroxy-β-amyrin | 酵母 | [107] |
2 | CYP71D353 | KF460438 | 百脉根 | dihydro-lupeol/20-hydroxy-lupeol | C-20羟基化/C-28氧化 | 20-hydroxy-lupeol/20-hydroxy-betulinic acid | 烟草/百脉根(毛状根) | [89] |
3 | CYP81Q58 | KM655862 | 黄瓜 | 19-hydroxy-cucurbitadienol | C-25羟基化/双键位移 | 19,25-dihydroxy cucurbitadienol | 酵母/黄瓜 | [20] |
4 | CYP81Q59 | – | 香瓜 | 11-carbonyl-20β-hydroxy-cucurbitadienol | C-2β羟基化 | 11-carbonyl-2β,20β-dihydroxy-cucurbitadienol | 酵母 | [82] |
5 | LjCYP93E1 | LC414182 | 百脉根 | β-amyrin | C-24羟基化 | 24-hydroxy-β-amyrin | 酵母/Lotus retrotransposon 1 (LORE1)-tagged lines | [64] |
6 | CYP93E1 | AF135485 | 大豆 | β-amyrin/24-hydroxy-β-amyrin/sophoradiol | C-24羟基化/C-24氧化 | 24-hydroxy-β-amyrin/24-carboxy-β-amyrin/soyasapogenol B | 酵母 | [108] |
7 | CYP93E2 | DQ335790 | 蒺藜苜蓿 | β-amyrin | C-24羟基化 | 24-hydroxy-β-amyrin | 酵母 | [106,108] |
8 | CYP93E3 | AB437320 | 甘草 | β-amyrin/24-hydroxy-β-amyrin | C-24羟基化/C-24氧化 | 24-hydroxy-β-amyrin/24-carboxy-β-amyrin | 酵母 | [108,109] |
9 | CYP93E4 | KF906535 | 花生 | β-amyrin/24-hydroxy-β-amyrin | C-24羟基化/C-24氧化 | 24-hydroxy-β-amyrin/24-carboxy-β-amyrin | 酵母 | [108] |
10 | CYP93E5 | KF906536 | 鹰嘴豆 | β-amyrin/24-hydroxy-β-amyrin | C-24羟基化/C-24氧化 | 24-hydroxy-β-amyrin/24-carboxy-β-amyrin | 酵母 | [108] |
11 | CYP93E6 | KF906537 | 光果甘草 | β-amyrin/24-hydroxy-β-amyrin | C-24羟基化/C-24氧化 | 24-hydroxy-β-amyrin/24-carboxy-β-amyrin | 酵母 | [108] |
12 | CYP93E7 | KF906538 | 小扁豆 | β-amyrin | C-24羟基化 | 24-hydroxy-β-amyrin | 酵母 | [108] |
13 | CYP93E8 | KF906539 | 豌豆 | β-amyrin/24-hydroxy-β-amyrin | C-24羟基化/C-24氧化 | 24-hydroxy-β-amyrin/24-carboxy-β-amyrin | 酵母 | [108] |
14 | CYP93E9 | KF906540 | 菜豆 | β-amyrin/24-hydroxy-β-amyrin | C-24羟基化/C-24氧化 | 24-hydroxy-β-amyrin/24-carboxy-β-amyrin | 酵母 | [108] |
15 | CYP72A67 | DQ335780 | 蒺藜苜蓿 | oleanolic acid/hederagenin/ gypsogenic acid/gypsogenin | C-2β羟基化 | 2β-hydroxy-oleanolic acid/bayogenin/medicagenic acid/2β, 3β-dihydroxyolean-12-en-23-oxo-28-oic acid | 酵母/蒺藜苜蓿(突变株系) | [110] |
16 | CYP72A61v2 | AB558145 | 蒺藜苜蓿 | 24-hydroxy-β-amyrin | C-22β羟基化 | soyasapogenol B | 酵母 | [111] |
17 | CYP72A69 | LC143440 | 大豆 | soyasapogenol B | C-21β羟基化 | soyasapogenol A | 酵母/大肠杆菌 | [112] |
18 | CYP72A475 | MH539812 | 燕麦 | 12,13β-epoxy, 16β-hydroxy-β-amyrin | C-21β羟基化 | 12,13β-Epoxy, 16β,21β-dihydroxy-β-amyrin | 烟草 | [113] |
19 | CYP72A63 | AB558146 | 蒺藜苜蓿 | β-amyrin | C-30氧化 | 11-deoxoglycyrrhetinic acid | 酵母 | [114] |
20 | CYP72A154 | AB558153 | 甘草 | β-amyrin/11-oxo-β-amyrin | C-30氧化 | 30-hydroxy-β-amyrin/glycyrrhetinic acid | 酵母 | [114] |
21 | CYP72A68v2 | DQ335782 | 蒺藜苜蓿 | oleanolic acid | C-23氧化 | gypsogenic acid | 酵母 | [111] |
22 | CYP72A397 | KT150517 | 刺楸 | oleanolic acid | C-23羟基化 | hederagenin | 酵母 | [76] |
23 | CYP72A552 | – | 欧洲山芥 | oleanolic acid | C-23羟基化 | hederagenin | 酵母/烟草 | [115] |
24 | CYP714E19 | KT004520 | 积雪草 | oleanolic acid/ursolic acid | C-23羟基化 | hederagenin/23-hydroxy ursolic acid | 酵母 | [116] |
25 | CYP716A1 | NM_123002 | 拟南芥 | α-amyrin/β-amyrin/lupeol | C-28氧化 | ursolic acid/oleanolic acid/betulinic acid | 酵母 | [117] |
26 | CYP716A12 | DQ335781 | 蒺藜苜蓿 | α-amyrin/β-amyrin/lupeol | C-28氧化 | ursolic acid/oleanolic acid/betulinic acid | 酵母 | [106,118] |
27 | CYP716A15 | AB619802 | 葡萄 | α-amyrin/β-amyrin/lupeol | C-28氧化 | ursolic acid/oleanolic acid/ betulinic acid | 酵母 | [106] |
28 | CYP716A51 | AB706297 | 百脉根 | α-amyrin/β-amyrin/lupeol | C-28氧化 | ursolic acid/oleanolic acid/betulinic acid | 酵母/百脉根毛状根(CRISPR/Cas9) | [64] |
29 | CYP716A154/CYP716AL1 | JN565975 | 长春花 | α-amyrin/β-amyrin/lupeol | C-28氧化 | ursolic acid/oleanolic acid/ betulinic acid | 酵母 | [119] |
30 | CYP716A175 | XM_008392874 | 苹果 | α-amyrin/β-amyrin/lupeol | C-28氧化 | ursolic acid/oleanolic acid/ betulinic acid | 酵母 | [84] |
31 | CYP716A265 | MG708187 | 大花紫薇 | α-amyrin/β-amyrin/lupeol | C-28氧化 | ursolic acid/oleanolic acid/betulinic acid | 酵母/烟草 | [55] |
32 | CYP716A266 | MG708188 | 大花紫薇 | α-amyrin/β-amyrin/lupeol | C-28氧化 | ursolic acid/oleanolic acid/betulinic acid | 酵母/烟草 | [55] |
33 | CYP716A2 | LC106013 | 拟南芥 | α-amyrin/β-amyrin/lupeol | C-16/C-22α/C-28羟基化 | 22α-hydroxy-α-amyrin/22α-hydroxy-β-amyrin/16-hydroxy-β-amyrin/betulin | 酵母 | [117] |
34 | CYP716A179 | LC157867 | 甘草 | α-amyrin/β-amyrin/lupeol | C-28氧化/C-22α 羟基化 | ursolic acid/oleanolic acid/betulinic acid | 酵母 | [120] |
35 | CYP716A259 | LC325360 | 白骨壤 | α-amyrin/β-amyrin/lupeol | C-28氧化 | ursolic acid/oleanolic acid/ betulinic acid | 酵母 | [121] |
36 | CYP716A140 | KU878853 | 桔梗 | β-amyrin/16β-hydroxy-β-amyrin/12,13α-epoxy-β-amyrin | C-28氧化 | oleanolic acid/16β-hydroxy-oleanolic acid/12,13α-epoxy-oleanolic acid | 酵母 | [103] |
37 | CYP716A14v2 | KF309251 | 黄花蒿 | α-amyrin/β-amyrin/δ-amyrin | C-3氧化 | α-amyrone/β-amyrone/δ-amyrone | 酵母/烟草/黄花蒿(RNAi) | [122] |
38 | CYP716A44 | AK329870 | 番茄 | α-amyrin/β-amyrin | C-28氧化 | ursolic acid/oleanolic acid | 酵母 | [123] |
39 | CYP716A46 | XM_004243858 | 番茄 | α-amyrin/β-amyrin | C-28氧化 | ursolic acid/oleanolic acid | 酵母 | [123] |
40 | CYP716A83 | KU878849 | 积雪草 | α-amyrin/β-amyrin | C-28氧化 | ursolic acid/oleanolic acid | 酵母 | [103] |
41 | CYP716A86 | KU878848 | 积雪草 | α-amyrin/β-amyrin | C-28氧化 | ursolic acid/oleanolic acid | 酵母 | [103] |
42 | CYP716A252 | JQ958967 | 罗勒 | α-amyrin/β-amyrin | C-28氧化 | ursolic acid/oleanolic acid | 酵母/罗勒(VIGS) | [124] |
43 | CYP716A253 | JQ958968 | 罗勒 | α-amyrin/β-amyrin | C-28氧化 | ursolic acid/oleanolic acid | 酵母/罗勒 (VIGS) | [124] |
44 | CYP716A80 | KP795926 | 欧洲山芥 | β-amyrin/lupeol | C-28氧化 | oleanolic acid/betulinic acid | 酵母/烟草 | [54] |
45 | CYP716A81 | KP795925 | 欧洲山芥 | β-amyrin/lupeol | C-28氧化 | oleanolic acid/betulinic acid | 酵母/烟草 | [54] |
46 | CYP716A141 | LC209200/KU8878855 | 桔梗 | β-amyrin/oleanolic acid | C-28氧化/C-16β羟基化 | oleanolic acid/16β-hydroxy-oleanolic acid | 酵母 | [103,105] |
47 | CYP716A180 | KJ452328 | 白桦 | lupeol | C-28氧化 | betulinic acid | 酵母 | [125] |
48 | CYP716A17 | AB619803 | 葡萄 | β-amyrin | C-28氧化 | oleanolic acid | 酵母 | [106] |
49 | CYP716A52v2 | JX036032 | 人参 | β-amyrin | C-28氧化 | oleanolic acid | 酵母 | [126] |
50 | CYP716A75 | KF318733 | 非洲灌木 | β-amyrin | C-28氧化 | oleanolic acid | 酵母/非洲灌木/蒺藜苜蓿 | [75] |
51 | CYP716A78 | KX343075 | 藜麦 | β-amyrin | C-28氧化 | oleanolic acid | 酵母 | [78] |
52 | CYP716A79 | KX343076 | 藜麦 | β-amyrin | C-28氧化 | oleanolic acid | 酵母 | [78] |
53 | CYP716A94 | KT150521 | 刺楸 | β-amyrin | C-28氧化 | oleanolic acid | 酵母 | [76] |
54 | CYP716A110 | KU878864 | 洛杉矶耧斗菜 | β-amyrin | C-28氧化 | oleanolic acid | 酵母 | [103] |
55 | CYP716A140v2 | LC209199 | 桔梗 | β-amyrin | C-28氧化 | oleanolic acid | 酵母 | [105] |
56 | CYP716A244 | KX354739 | 刺五加 | β-amyrin | C-28氧化 | oleanolic acid | 酵母/烟草 | [77] |
57 | CYP716A254 | – | 鹅掌草 | β-amyrin | C-28氧化 | oleanolic acid | 酵母 | [127] |
58 | CYP716A111 | KY047600 | 洛杉矶耧斗菜 | β-amyrin | C-16β羟基化 | 16β-hydroxy-β-amyrin | 酵母 | [103] |
59 | CYP716C11 | KU878852 | 积雪草 | ursolic acid/oleanolic acid/6β-hydroxy-oleanolic acid | C-2α羟基化 | corosolic acid /maslinic acid/6β-hydroxy-maslinic acid | 酵母 | [103] |
60 | CYP716C53 | LC325362 | 白骨壤 | oleanolic acid/ursolic acid | C-2α羟基化 | maslinic acid/corosolic acid | 酵母 | [121] |
61 | CYP716C55 | MG708191 | 大花紫薇 | ursolic acid/oleanolic acid | C-2α羟基化 | corosolic acid/maslinic acid | 酵母/烟草 | [55] |
62 | CYP716E26 | XM_004241773 | 番茄 | α-amyrin/β-amyrin | C-6β羟基化 | 6β-hydroxy-α-amyrin/daturadiol | 酵母 | [123] |
63 | CYP716E41 | KU878851 | 积雪草 | ursolic acid/oleanolic acid/maslinic acid | C-6β羟基化 | 6β-hydroxy-ursolic acid/6β-hydroxy-oleanolic acid/6β-hydroxy-maslinic acid | 酵母 | [103] |
64 | CYP716S1v2/CYP716A53v2 | JX036031 | 人参 | protopanaxadiol | C-6羟基化 | protopanaxatriol | 酵母/人参 | [119,128] |
65 | CYP716S5 | KU878856 | 桔梗 | β-amyrin/oleanolic acid | C-12,13α环氧化 | 12,13α-epoxy-β-amyrin/12,13α-epoxy-oleanolic acid | 酵母 | [103] |
66 | CYP716U1/CYP716A47 | JN604536 | 人参 | dammarenediol-II | C-12羟基化 | protopanaxadiol | 酵母/人参 | [129] |
67 | CYP716Y1 | KC963423 | 柴胡 | α-amyrin/β-amyrin | C-16α羟基化 | 16α-hydroxy-α-amyrin/16α-hydroxy-β-amyrin | 酵母 | [100,103] |
68 | CYP87D16 | KF318735 | 非洲灌木 | β-amyrin | C-16α羟基化 | 16α-hydroxy-β-amyrin | 酵母/非洲灌木/蒺藜苜蓿 | [75] |
69 | CYP87D18 | HQ128570 | 罗汉果 | 11α-hydroxy-cucurbitadienol/24,25-epoxy-cucurbitadienol/24,25-dihydroxy-cucurbitadienol | C-11羟基化/氧化 | 11-oxo-cucurbitadienol/11-oxo-24,25-epoxy-cucurbitadienol/mogrol | 酵母 | [6,130] |
70 | CYP87D20 | KM655862 | 黄瓜 | cucurbitadienol/11-oxo-cucurbitadienol | C-11氧化/C-20β羟基化 | 11-oxo-cucurbitadienol/11-carbonyl-20β-hydroxy-cucurbitadienol | 酵母 | [82] |
71 | CYP88D6 | AB433179 | 甘草 | β-amyrin | C-11氧化 | 11-oxo-β-amyrin | 酵母 | [109] |
72 | CYP88L2 | NP_001295866 | 黄瓜 | cucurbitadienol | C-19羟基化 | 19-hydroxy-cucurbitadienol | 酵母/黄瓜(RNAi) | [20,82] |
73 | CYP88A13 | MN200611 | 蒺藜苜蓿 | medicagenic acid | C-16α羟基化 | zanhic acid | 酵母/烟草/蒺藜苜蓿根毛 | [131] |
(3) 糖基转移酶.
来自糖基转移酶家族1的糖基转移酶(UGTs, EC2.4.1.x), 主要参与植物中天然产物的糖基化, 能将尿嘧啶核苷二磷酸糖上的活性糖基转移到植物中的小分子化合物受体上[132], 与三萜皂苷生物合成相关的糖基转移酶属于这一类. UGTs催化进行的三萜糖基化通常被认为是三萜皂苷生物合成的最后一步, 是三萜皂苷的多样性和生物活性形成的关键环节[3]. 典型的三萜皂苷含有2~5个糖元, 通常在皂苷元的C-3和/或C-28位置上形成糖链; 也存在C-4, C-16, C-20, C-21, C-22和/或C-23位置糖基化的三萜皂苷[1,132]. 常见的糖元有葡萄糖(glucose, Glc)、半乳糖(galactose, Gal)、葡萄糖醛酸(glucoronic acid, GlcA)、鼠李糖(rhamnose, Rha)、木糖(xylose, Xyl)和阿拉伯糖(arabinose, Ara)等五元糖或六元糖. 糖链的数量、组成及其在三萜骨架上的位置, 均影响着三萜皂苷的生物活性、稳定性、溶解性和细胞分隔性[102].
UGTs也以基因家族的形式存在于植物体内. 根据氨基酸序列的同源性及其催化特征, UGTs被分为不同的家族(同源性>40%)和亚家族(同源性>60%)[3,133]. 尽管序列同源性不高, 但典型的植物次级代谢性UGTs具有相似的结构域, 拥有PSPG(plant secondary product glycosyltransferase)基序, 该基序是UGTs中与底物结合的区域[2,25].
随着高通量测序技术的不断发展, 越来越多植物的UGT基因序列被公布, 但仅有少数几种植物中的UGTs基因被克隆和鉴定, 其中有44个参与了三萜皂苷的生物合成, 总结在表4中, 这些UGTs主要来自UGT71, 73, 74, 85, 91和94家族[2]. 对这些UGT基因进行系统发育分析, 结果显示, 不同家族的UGTs处在发育树的不同分枝上(图5), 且具有相似的功能. 例如, UGT73家族的成员多数具有C-3或C-28位葡萄糖糖基化活性, 而UGT74s和UGT94s常表现出C-3位葡萄糖糖基化作用. 来自不同家族的UGTs可能具有相同的区域选择性, 不同的UGTs在不同底物的同一位置可以有相同的功能[2]. 然而, 植物UGTs具有很大程度的底物混乱性, 所以仅通过序列分析和体外生化研究来预测UGTs的生物功能仍不够准确[3,134]. Ribeiro等人[131]还发现, 已鉴定的皂苷生物合成酶基因在蒺藜苜蓿基因组上常常表现为重复簇状排列, 该特征在糖基转移酶编码基因中尤为明显, 这或许是皂苷代谢进化的驱动力之一.
Table 4 Overview of UGTs related to triterpenoid saponin biosynthesis reported in literaturesa)
编号 | 基因 | GenBank登录号 | 植物来源 | 底物 | 反应 | 产物 | 功能分析方法 | 参考文献 |
1 | UGT71G1 | AY747627 | 蒺藜苜蓿 | medicagenic acid,UDP-Glc | 糖基化 | medicagenic acid-Glc | 大肠杆菌 | [134] |
2 | UGT73AD1 | KP195716 | 积雪草 | asiatic acid/madecassic acid, UDP-Glc | C-28β糖基化 | 28β-Glc-asiatic acid/28β-Glc-madecassic acid | 大肠杆菌 | [135] |
3 | UGT73AE1 | KJ956788 | 红花 | glycyrrhetinic acid, UDP-Glc | O/S/N-糖基化 | glycyrrhizin | 大肠杆菌 | [136] |
4 | UGT73AH1 | MF471454 | 积雪草 | asiatic acid, UDP-Glc | C-28糖基化 | 28-Glc-asiatic acid | 大肠杆菌 | [137] |
5 | UGT73AM3 | – | 黄瓜 | cucurbitacin C,UDP-Glc | C-3糖基化 | 3-O-β-D-Glc- cucurbitacin C | 大肠杆菌/黄瓜 | [138] |
6 | UGT73C10 | JQ291613 | 欧洲山芥 | β-amyrin/oleanolic acid/betulinic acid/hederagenin/3-Glc-oleanolic acid, UDP-Glc | C-3/C-28糖基化 | 3-Glc-β-amyrin/3-Glc-oleanolic acid/3-Glc-betulinic acid/28-Glc-betulinic acid/3-Glc-hederagenin/3-Glc-28-Glc-oleanolic acid | 大肠杆菌 | [139] |
7 | UGT73C11 | JQ291614 | 欧洲山芥 | β-amyrin/oleanolic acid/betulinic acid/hederagenin, UDP-Glc | C-3/C-28糖基化 | 3-Glc-β-amyrin/3-Glc-oleanolic acid/3-Glc-betulinic acid/3-Glc-hederagenin/28-Glc-betulinic acid | 大肠杆菌/烟草 | [139,140] |
8 | UGT73C12 | JQ291615 | 欧洲山芥 | β-amyrin/oleanolic acid/betulinic acid/hederagenin/3-Glc-oleanolic acid/3-Glc-hederagenin, UDP-Glc | C-3/C-28糖基化 | 3-Glc-β-amyrin/3-Glc-oleanolic acid/3-Glc-betulinic acid/28-Glc-betulinic acid/3-Glc-hederagenin/3-Glc-28-Glc-oleanolic acid/3-Glc-28-Glc-hederagenin/3-Glc-28-Glc-betulinic acid | 大肠杆菌 | [139] |
9 | UGT73C13 | JQ291616 | 欧洲山芥 | β-amyrin/oleanolic acid/betulinic acid/hederagenin/3-Glc-oleanolic acid/3-Glc-hederagenin, UDP-Glc | C-3/C-28糖基化 | 3-Glc-β-amyrin/3-Glc-oleanolic acid/3-Glc-betulinic acid/28-Glc-betulinic acid/3-Glc-hederagenin/3-Glc-28-Glc-oleanolic acid/3-Glc-28-Glc-hederagenin/3-Glc-28-Glc-betulinic acid | 大肠杆菌/烟草 | [139] |
10 | UGT73C22 | MF448363 | 欧洲山芥 | oleanolic acid/hederagenin, UDP-Glc | C-3/C-28糖基化 | 3-Glc-oleanolic acid/3-Glc-28-Glc-oleanolic acid/3-Glc-28-Glc-hederagenin/28-Glc-hederagenin/28-Glc-oleanolic acid | 大肠杆菌/烟草 | [139] |
11 | UGT73C23 | MF448369 | 欧洲山芥 | oleanolic acid/hederagenin, UDP-Glc | C-3/C-28糖基化 | 3-Glc-oleanolic acid/3-Glc-28-Glc-oleanolic acid/3-Glc-hederagenin/3-Glc-28-Glc-Hederagenin/3-glc-23-glc-hederagenin | 大肠杆菌/烟草 | [140] |
12 | UGT73C25 | MF448366 | 欧洲山芥 | oleanolic acid/hederagenin, UDP-Glc | C-3/C-23/C-28糖基化 | 3-Glc-oleanolic acid/3-Glc-28-Glc-oleanolic acid/3-Glc-hederagenin/3-glc-23-glc-hederagenin | 大肠杆菌/烟草 | [140] |
13 | UGT73C21 | MF448360 | 欧洲山芥 | oleanolic acid/hederagenin, UDP-Glc | C-3糖基化 | 3-Glc-oleanolic acid/3-Glc-hederagenin | 大肠杆菌/烟草 | [140] |
14 | UGT73C26 | MF448353 | 欧洲山芥 | oleanolic acid/hederagenin, UDP-Glc | C-3糖基化 | 3-Glc-oleanolic acid/3-Glc-hederagenin | 大肠杆菌/烟草 | [140] |
15 | UGT73C27 | MF448357 | 欧洲山芥 | oleanolic acid/hederagenin, UDP-Glc | C-3糖基化 | 3-Glc-oleanolic acid/3-Glc-hederagenin | 大肠杆菌/烟草 | [140] |
16 | UGT73F18 | MN200615 | 蒺藜苜蓿 | medicagenic acid | C-3糖基化 | 3-Glc-medicagenic acid | 酵母/烟草 | [131] |
17 | UGT73F19 | MN200616 | 蒺藜苜蓿 | medicagenic acid/gypsogenic acid | C-3糖基化 | 3-Glc-medicagenic acid/3-Glc-gypsogenic acid | 酵母/烟草 | [131] |
18 | PjOAGT | MH819287 | 竹节参 | oleanolic acid,UDP-GlcA | C-3糖基化 | oleanolic acid 3-O-glucoronide | 大肠杆菌 | [141] |
19 | PzOAGT1 | MH819284 | 姜状三七 | oleanolic acid,UDP-GlcA | C-3糖基化 | oleanolic acid 3-O-glucoronide | 大肠杆菌 | [141] |
20 | PzOAGT2 | MH819285 | 姜状三七 | oleanolic acid,UDP-GlcA | C-3糖基化 | oleanolic acid 3-O-glucoronide | 大肠杆菌 | [141] |
21 | PzOAGT3 | MH819286 | 姜状三七 | oleanolic acid,UDP-GlcA | C-3糖基化 | oleanolic acid 3-O-glucoronide | 大肠杆菌 | [141] |
22 | GuUGAT | KT759000 | 甘草 | glycyrrhetinic acid/3-GlcA-glycyrrhetinic acid, UDP-GlcA | C-3糖基化 | 3-GlcA-glycyrrhetinic acid/glycyrrhizin | 大肠杆菌 | [142] |
23 | UGT73F2 | AB628089 | 大豆 | saponin A0-gα,UDP-Glc | C-22糖基化 | saponin Ab | 大肠杆菌/定点突变分析/转基因互补试验 | [143] |
24 | UGT73F3 | FJ477891 | 蒺藜苜蓿 | hederagenin/soyasapogenol A/soyasapogenol B/bayogenin/medicagenic acid, UDP-Glc | C-28/C-3糖基化 | hederagenin-C28-O-Glc/ soyasapogenol A-Glc /soyasapogenol B-Glc/ bayogenin-C28-O-Glc/ medicagenic acid-C28-O-Glc | 大肠杆菌/蒺藜苜蓿(基因功能缺失分析) | [144] |
25 | UGT73F4 | AB628091 | 大豆 | saponin A0-αg,UDP-Xyl | C-22糖基化 | saponin Aa | 大肠杆菌/定点突变分析/转基因互补试验 | [143] |
26 | UGT73B4 | NM_001367432 | 大豆 | soyasapogenol B/soyasaponin I, UDP-Glc/UDP-Gal | C-22糖基化 | 22-Glc-soyasapogenol B,22-Gal-soyasapogenol B,22-Glc-soyasaponin I, 22-Gal-soyasaponin I | 大肠杆菌 | [145] |
27 | UGT73F17 | MH049688 | 甘草 | glycyrrhizin, UDP-Glc | C-30/C-29糖基化 | licorice-saponin A3 | 大肠杆菌 | [146] |
28 | UGT73K1 | AY747626 | 蒺藜苜蓿 | hederagenin/soyasapogenol B/soyasapogenol E, UDP-Glc | 糖基化 | hederagenin-Glc,soyasapogenol B-Glc,soyasapogenol E-Glc | 大肠杆菌 | [134] |
29 | UGT74AE2 | JX898529 | 人参 | protopanaxadiol/ginsenoside compound K, UDP-Glc | C-3糖基化 | ginsenoside Rh2/ginsenoside F2 | 酵母 | [147] |
30 | UGT74M1 | DQ915168 | 麦蓝菜 | gypsogenic acid/betulinic acid/hederagenin/gypsogenin/echinocystic acid/16α-hydroxygypsogenic acid/quillaic acid, UDP-Glc | C-28糖基化 | 28-Glc-gypsogenic acid/28-Glc-betulinic acid/28-Glc-hederagenin/28-Glc-gypsogenin/28-Glc-echinocystic acid/28-Glc-16α-hydroxygypsogenic acid/28-Glc-quillaic acid | 大肠杆菌 | [70] |
31 | UGT94Q2 | JX898530 | 人参 | ginsenoside Rh2/ginsenoside F2, UDP-Glc | C-3糖基化 | ginsenoside Rg3/ginsenoside Rd | 酵母/西洋参/人参(RNAi) | [147,148] |
32 | UGT71A27 /UGTPg1 | KM491309 | 人参 | dammarenediol-II/protopanaxadiol/protopanaxatriol/ginsenoside Rh2/ginsenoside Rg3,UDP-Glc | C-20糖基化 | 20S-O-β-(D-glucosyl)-dammarenediol II(DMG)/ginsenoside compound K/ginsenoside F1/ginsenoside F2/ginsenoside Rd | 酵母 | [21] |
33 | UGTPg100 | KP795113 | 人参 | protopanaxatriol,UDP-Glc | C-6糖基化 | ginsenoside Rh1 | 酵母 | [149] |
34 | UGTPg101 | KP795114 | 人参 | protopanaxatriol/ginsenoside F1,UDP-Glc | C-20/C6糖基化 | ginsenoside F1/ginsenoside Rg1 | 酵母 | [149] |
35 | UGTPg45 | KM401918 | 人参 | protopanaxadiol/ginsenoside compound K, UDP-Glc | C-3糖基化 | ginsenoside Rh2/ ginsenoside F2 | 酵母/大肠杆菌 | [150] |
36 | UGTPg29 | KM401911 | 人参 | ginsenoside Rh2/ginsenoside F2, UDP-Glc | C-3糖基化 | ginsenoside Rg3/ginsenoside Rd | 酵母/大肠杆菌 | [150] |
37 | Pq3-O-UGT2 (UGT94) | KR106207 | 西洋参 | ginsenoside Rh2/ginsenoside F2, UDP-Glc | C-3糖基化 | ginsenoside Rg3/ginsenoside Rd | 酵母/西洋参/人参毛状根(RNAi) | [148] |
38 | Pq3-O-UGT1 (UGT74) | KiR028477 | 西洋参 | protopanaxadiol, UDP-Glc | C-3糖基化 | ginsenoside Rh2 | 酵母/西洋参毛状根(超表达/RNAi) | [151] |
39 | UGT73P2/GmSGT2 | AB473730 | 大豆 | soyasapogenol B/3-O-glucuronide, UDP-Gal | C-3糖基化 | soyasaponin III | 大肠杆菌 | [152] |
40 | UGT91H4/GmSGT3 | AB473731 | 大豆 | soyasaponin III, UDP-Rha | C-3糖基化 | soyasaponin I | 大肠杆菌 | [152] |
41 | UGRdGT | – | 三七 | ginsenoside Rd, UDP-Glc | 糖基化 | ginsenoside Rb1 | 体外生物转化 | [153] |
42 | UGT74AC1 | HQ259620 | 罗汉果 | mogrol, UDP-Glc | C-3糖基化 | mogroside IE | 大肠杆菌 | [81] |
43 | UGT720-269-1 | – | 罗汉果 | mogrol/mogroside I-A1, UDP-Glc | C-3/C-24糖基化 | mogroside I-A1/mogroside IIE | 酵母/大肠杆菌 | [6] |
44 | UGT94-289-3 | – | 罗汉果 | mogroside IIE/mogroside IIIx/mogroside IV-A/siamenoside, UDP-Glc | C-3/C-24糖基化 | mogroside IIIx/mogroside IV-A/siamenoside/mogroside V | 酵母/大肠杆菌 | [6] |
3 三萜皂苷生物合成的调控
植物中, 三萜皂苷的生物合成受基因调控的影响. 通过增加基因拷贝数或沉默竞争代谢通路基因, 可人为改变三萜生物合成途径基因的表达, 提高三萜皂苷化合物的含量[8]. 研究表明, 通过HMGR, FPS, SS和SE基因的过表达或RNAi(RNA interference)可实现人参、三七等植物中三萜皂苷生物合成的调控[27,33,154,155]. 此外, 茉莉酸衍生物(如茉莉酸甲酯, methyl jasmonate, MeJA)的外源处理能影响植物中三萜皂苷的积累. 在人参、积雪草、三七、西洋参、藜麦等植物中, MeJA处理能提高植物体内、离体组织或细胞内FPS, SS, SE, OSCs, CYP450s及UGTs等酶基因的表达活性, 从而影响其皂苷的积累[2,29,33,42,78,119,129,151,156~158], 但不同酶对MeJA的响应存在差异. 三萜皂苷的生物合成除了受相关酶基因调控外, 还受到转录因子和microRNA(miRNA)等在转录或转录后水平上的调控. 因此, 下文将对植物三萜皂苷生物合成中已报道的转录因子和miRNA进行总结.
3.1 转录因子
转录因子(transcription factors, TFs)是一类DNA结合蛋白, 可以通过自身或与其他蛋白的相互作用激活或抑制基因转录[159]. TFs在植物次生代谢产物生物合成过程中可以同时控制多个关键基因的表达. 目前, 已报道调控植物三萜生物合成的TFs类型有bHLH(basic helix-loop-helix)、AP2/ERF(APETALA2/ethylene-responsive factor)、bZIP(basic region/leucine zipper motif)、WRKY等四种(图6). Mertens等人[160]从蒺藜苜蓿中鉴定出两种同源的碱性螺旋-环-螺旋(helix-loop-helix)家族的MeJA诱导转录因子(bHLH TFs), TSAR1(triterpene saponin biosynthesis activating regulator 1)和TSAR2. 其中, TSAR1可以促进非溶血性大豆皂苷的生物合成, 激活bAS, CYP93E2, CYP72A61v2等相关酶基因的表达, TSAR2可促进溶血性大豆皂苷的合成, 并激活bAS, CYP716A12和CYP72A68v2等相关酶基因的表达. 而后, 该研究团队基于蒺藜苜蓿种子发育的转录组数据, 通过基因共表达分析, 鉴定出另一个转录因子TSAR3, 该转录因子可以激活bAS, CYP716A12, CYP72A67, CYP72A68, CYP88A13和UGT73F3等相关酶基因的表达, 促进蒺藜苜蓿中溶血性皂苷的合成[131]. 甘草中的bHLH3可激活bAS, CYP93E3和CYP72A566的表达, 且系统发育分析表明, bHLH3与TSAR2(53%)的氨基酸序列相似性高于TSAR1(43%)[161]. Jarvis等人[162]发现了藜麦中的两个bHLH转录因子TSARL1和TSARL2, 它们可以增加藜麦体内三萜生物合成途径中基因的表达. 此外, 研究学者们也在黄瓜[20]、三七[163]、人参[164]、白桦[165]等植物中发现了调控三萜生物合成的bHLH转录因子. 近年来, 研究还发现, bHLH转录因子与植物三萜类化合物生物合成相关基因簇的表达调控有关, 例如, TSAR1和TSAR2参与HMGR1和MKB1(MAKIBISHI1, RING membrane anchor-like E3 ubiquitin ligase)所在基因簇的表达调控, 促进蒺藜苜蓿三萜皂苷生物合成[160]; 而黄瓜中的两个组织特异性bHLH转录因子Bl(bitter leaf)和Bt(bitter fruit)可以对葫芦素合成相关基因簇进行调控[20]. 除了bHLH家族外, 也发现了AP2/ERF, bZIP, WRKY家族的转录因子参与植物三萜皂苷生物合成调控的情况, 例如, 三七中的AP2/ERF转录因子ERF1, 在三七皂苷生物合成中起正调控因子作用[159]; 而北柴胡(Bupleurum chinense)中的bZIP转录因子bZIP134, 起着负调控柴胡皂苷生物合成的作用[166]. 南非醉茄中的WRKY转录因子WRKY1对其体内三萜化合物withanolides的生物合成起着积极的调控作用[167]. Sun等人[168]报道, 西洋参中的WRKY1可以调控拟南芥中的FPPS, SQS和SQE等三萜合成途径基因, 但并未研究其对三萜类代谢产物的影响. 现今, 关于三萜皂苷生物合成相关转录因子的研究仍较少, 加强此方面的研究不仅有助于了解植物三萜皂苷代谢途径的调控机制, 还可以将其作为调控工具应用到相关代谢工程, 助力植物三萜皂苷基础研究和人工合成的发展.
3.2 miRNA
miRNA是一类内源性非编码小RNA, 在植物基因表达调控中发挥着重要作用[169]. 近年来, 研究发现miRNA是许多植物中调节次级代谢物产生的主要生物因子[170]. 因此, 为了高效获取植物中的三萜皂苷, 除了确定其合成和代谢途径的关键酶基因和转录因子, 研究miRNA在转录后水平对关键酶基因和相关转录因子的调控作用也是至关重要的. 随着高通量测序技术和生物信息学的快速发展, 越来越多植物的miRNA被预测出来. Mathiyalagan等人[171]研究表明, miR854e可能靶向调控高丽参人参皂苷生物合成中的FPS基因, 而miR1439b和miR1439h可能靶向调控βAS基因. Wei等人[172]预测三七中的miR5021, miR5163, miR5293和novel_miR_27可能靶向调控萜类主链生物合成途径中的基因. Fan等人[173]结合转录组数据对苍耳(Xanthium strumarium)中miRNA及其靶基因进行了鉴定与分析, 结果表明, miR5255和miR5491分别靶向调控SE和βAS, 进而对萜类生物合成进行调控. 李华云等人[174]、陈艳琳等人[175]分别对长白山人参和甘草中miRNA的靶基因进行了预测和相应的生物信息学分析. Kajal和Singh[176]报道吊兰(Chlorophytum borivilianum)中的miR9662, miR894, miR172和miR166可能参与了其体内三萜皂苷生物合成的调控. 这些工作为miRNA在三萜皂苷生物合成中的调控机制研究提供了数据资源, 然而, 三萜皂苷生物合成相关的miRNA研究仍处于起步阶段, 迄今为止报道的相关miRNA仍较少, 且多数仅进行了功能预测, 这些miRNA作用的靶基因及其调控植物三萜皂苷代谢的分子机制仍有待进一步研究.
4 微生物细胞工厂中三萜皂苷的合成
合成生物学是涉及分子生物学、微生物学、生物工程、计算科学以及材料科学等多个领域的具有巨大潜力的综合性学科, 以生命科学理论为指导, 旨在通过参考化合物的生物合成途径, 人工设计、构建具有某种特定功能或全新的生物系统[177,178]. 目前, 合成生物学已被广泛应用于药物生产、疫苗开发、再生医学等方面[179]. 随着合成生物学的发展和植物三萜皂苷生物合成途径的不断解析, 利用合成生物学理论和技术生产结构复杂、稀有的生物活性三萜皂苷已取得了一定成果.
通过合成生物学技术在微生物中设计代谢途径和模块组成的生物元件, 利用微生物的发酵工程生产次生代谢产物, 已成为现今获得稀有次生代谢产物的一种最先进、最快捷的方式. 与植物相比, 微生物具有生长快、节约土地、大规模发酵等优点. 其中, 酵母是最常用微生物, 尤其在三萜皂苷的合成上拥有独特的优势, 这是由于酵母细胞膜上可以积累大量的三萜类化合物麦角固醇或合成途径的中间体. 近年来, 随着合成生物学的发展, 一些三萜皂苷和苷元已在微生物细胞工厂成功合成(表5). 在微生物细胞工厂中从头合成人参皂苷是当前研究的热点, 目前, 已在酿酒酵母(Saccharomyces cerevisiae)中成功合成了三种苷元(原人参二醇, protopanoxadiol, PPD; 原人参三醇, protopanaxatriol, PPT; 齐墩果酸, oleanolic acid, OA)、两种非天然人参皂苷(compound K, CK; 3β,12β-Di-O-Glc-PPD)和四种天然人参皂苷(Rh2, Rg3, RF1和Rh1). Han等人[129]将人参达玛烯二醇合成酶(PgDS)、人参CYP716A47和拟南芥CYP450还原酶1(AtCPR1)基因导入酿酒酵母中共表达, 首次在微生物中合成了人参皂苷苷元PPD. 随后, 该研究团队又在酵母工程菌中相继合成了PPT和OA[119,126], 但是这三种人参皂苷元在酵母中的产量均较低. 为了提高产量, Dai等人[180]通过提高关键基因的表达活性和进行相关编码基因密码子优化等措施, 使PPD产量增加了262倍; 在此基础上, 再通过双相发酵工艺优化, 最终使PPD产量提高到1.2 g/L. 研究还发现, 把OA, PPD和PPT的功能模块导入同一底盘细胞, 可同时生产这三种人参皂苷元, 这便是第一代基于多组分概念的“人参酵母”细胞工厂[181]. 另外, 相关研究团队还报道了细胞工厂生产三萜10 g/L级别的方案, 可以使酵母工程菌生产的达玛烯二醇产量高达15 g/L[188]. 中国科学院上海植物生理生态研究所与中国科学院上海药物研究所合作, 对人参皂苷CK, Rh2, Rg3, RF1和Rh1生物合成途径中的关键糖基转移酶和P450还原酶PgCPR1进行了详细研究, 通过酵母细胞工厂的构建和优化, 实现了利用单糖发酵生产这些稀有人参皂苷的工艺[21,149,150]. 此外, 科研工作者也开展了酿酒酵母生产甘草次酸(glycyrrhetinic acid, GA)[184]、柴胡皂苷元[100]和罗汉果苷V[6]等方面的研究. Wang等人[189]将密码子优化的CYP88D6和CYP72A154, 与β-AS和来自拟南芥的细胞色素P450还原酶(NADPH-cytochrome P450)基因引入酿酒酵母中, 成功合成了GA(14 μg/L); 进一步研究发现, 甘草细胞色素b5(GuCYB5)的引入, 可使GA产量提高8倍; 采用组合发酵策略, GA产量可提高近630倍, 达8.78 mg/L; 通过使用不同植物源的细胞色素P450还原酶和增加Uni25647的拷贝数, 可使GA产量增加到(18.9±2.0) mg/L[184]. 中国科学院天津工业生物技术研究所团队还报道了一个涵盖差异转录组分析、代谢物分析、候选基因在底盘细胞中的表征、化合物鉴定和植物组织培养的“即插即用”生物合成途径快速解析平台, 并通过该平台开发出了生产山楂酸(384 mg/L)和科罗索酸(141 mg/L)的酿酒酵母细胞 工厂[186,187].
Table 5 Heterologous synthesis of several important triterpenoids
三萜皂苷或中间体 | 产量 | 参考文献 |
原人参二醇(PPD) | 1.2 g/L | [180] |
原人参三醇(PPT) | 15.9 mg/L | [181] |
人参皂苷CK(ginsenoside CK) | 1.4 mg/L | [21] |
人参皂苷Rg3 | 1.3 mg/L | [147] |
人参皂苷RF1 | 42.1 mg/L | [149] |
人参皂苷Rh1 | 92.8 mg/L | [149] |
人参皂苷Rh2 | 300 mg/L | [182] |
3β,12β-Di-O-Glc-PPD | 9.05 mg/L | [183] |
甘草次酸(GA) | 18.9 mg/L | [184] |
齐墩果酸 | 606.9 mg/L | [185] |
山楂酸 | 384 mg/L | [186,187] |
科罗索酸 | 141 mg/L | [186,187] |
虽然三萜皂苷在微生物细胞工厂中的合成已取得了一定的进展, 但仍面临着许多挑战, 例如, 大多数三萜皂苷的生物合成途径尚不清楚, 一些关键酶很难在微生物宿主中表达, 某些三萜皂苷对微生物细胞具有毒性, 工程细胞异源合成效率低, 人工智能等自动化技术使用程度较低等. 针对这些问题, 研究学者们也陆续提出了许多解决方案, 比如使用底物混杂酶[182], 将蛋白质工程[190]、形态学工程[191]等技术应用其中, 进行代谢流量动态调节和区域化设置[5,100]等. 随着生物学技术和人工智能技术的发展, 三萜皂苷的人工合成将迎来新的时代.
5 展望
三萜皂苷是植物中一类重要的次级代谢产物, 在植物和外界环境的相互作用中起着重要作用, 且具有多种应用价值, 与人类的生活和发展息息相关. 随着现代生物技术的发展, 三萜皂苷生物合成途径不断被解析, 关键酶基因、转录调控、生物工程方面的研究也取得了一定进展. 相关研究主要集中在三萜皂苷生物合成后修饰阶段关键酶(OSC, CYP450和UGT)基因的发掘, 并在微生物(酵母)和/或异源宿主(如模式植物: 烟草)中进行功能分析, 但其中大多数在植物体内的功能仍处于未知状态; 而且关键酶的具体催化过程、结构修饰和转录调控机制(转录因子、miRNA等)方面的研究依然较少, 人们对三萜皂苷生物合成途径的认识仍不够系统和全面; 再加上三萜皂苷种类繁多, 在植物中的生物合成途径冗长而复杂, 使得三萜皂苷生物合成途径全面解析、植物体内三萜皂苷代谢调控和采用合成生物学及体外培养等方法来生产三萜皂苷仍存在困难.
随着分子生物学、生物信息学、代谢组学、蛋白组学和合成生物学等学科的发展及其在各个领域的应用和渗透, 以大数据为驱动, 开展多层次的研究, 将加速三萜皂苷的基础研究和相关产业发展. 未来, 或可加强以下四方面研究.
(1) 利用多组学和大数据进行三萜皂苷生物合成途径功能基因的发掘和代谢调控网络的研究, 构建从基因到代谢的调控网络, 并将功能基因组学技术(如VIGS, RNAi和CRISPR/Cas9等)应用到非模式植物中, 探讨其生化功能, 明确三萜皂苷合成的调控机制, 进一步解析植物三萜皂苷的生物合成途径.
(2) 进行三萜皂苷在植物体内合成部位及其转运机制研究. 研究三萜皂苷合成部位, 并构建相关元件特异性表达的启动子, 使其只在合成部位表达, 实现三萜皂苷的定向合成; 或通过沉默竞争途径关键酶基因的表达, 来增强三萜皂苷的生物合成; 开展三萜皂苷相关转运蛋白及其转运机制的研究.
(3) 开展三萜皂苷合成生物学研究. 将基因工程技术和生物工程技术结合, 在微生物中构建三萜皂苷代谢途径, 通过微生物生产大量有价值的三萜皂苷. 可以通过提高前体物质的供给、增加相关酶基因的效率, 或抑制竞争代谢途径, 改善培养条件等来提高目标代谢物的生产. 同时, 加强人工智能等自动化技术在微生物细胞工厂方面的应用.
(4) 通过体外组织培养来生产三萜皂苷. 采用植物组织培养、细胞培养、体细胞胚胎发生和根培养等方法来生产三萜皂苷, 并将细胞工程技术、基因工程等技术应用其中, 获得高效合成三萜皂苷、遗传性质稳定、培养特性优良的基因工程植物细胞系, 以实现三萜皂苷的大规模生产.