生物工程学报  2022, Vol. 38 Issue (1): 343-358
http://dx.doi.org/10.13345/j.cjb.210321
中国科学院微生物研究所、中国微生物学会主办
0

文章信息

赵伟, 李锡香, 王海平, 贾会霞, 宋江萍, 阳文龙, 张晓辉
ZHAO Wei, LI Xixiang, WANG Haiping, JIA Huixia, SONG Jiangping, YANG Wenlong, ZHANG Xiaohui
萝卜TALE转录因子家族的鉴定与分析
Identification and analysis of the TALE transcription factor family in radish
生物工程学报, 2022, 38(1): 343-358
Chinese Journal of Biotechnology, 2022, 38(1): 343-358
10.13345/j.cjb.210321

文章历史

Received: April 29, 2021
Accepted: September 17, 2021
Published: October 5, 2021
萝卜TALE转录因子家族的鉴定与分析
赵伟 , 李锡香 , 王海平 , 贾会霞 , 宋江萍 , 阳文龙 , 张晓辉     
中国农业科学院蔬菜花卉研究所 农业农村部园艺作物生物学与种质创制综合重点实验室 农业农村部蔬菜作物基因资源与种质创制北京科学观测实验站,北京 100081
摘要:TALE (three-amino acid loop extension) 转录因子在植物生长发育及细胞分化过程中起重要作用。在多种植物中均已鉴定出TALE转录因子的家族成员,但是萝卜TALE转录因子家族的研究鲜有报道。文中通过生物信息学手段在象牙白萝卜全基因组中鉴定出了分布于9条染色体上的33个TALE家族基因。研究结果显示,该家族中除与拟南芥KNATM同源的基因Rsa10037940外,其余基因均含有编码HOX保守结构域的序列。这些基因含有4–6个外显子。萝卜的33个TALE基因与拟南芥中的17个同源基因存在共线性关系。33个TALE基因启动子区的顺式元件中包含大量逆境响应元件。表达特性分析显示,该基因家族BELL亚家族内有4个基因在根内表达量较高,KNOX亚家族内有2个基因在薹和愈伤中表达量较高。该家族不同亚型成员之间的蛋白3D结构高度相似。编码蛋白均为弱酸、有亲水性。萝卜TALE基因家族在进化上较为保守,分化上与拟南芥存在一致性,与水稻差异较大。本研究为开展萝卜中TALE转录因子的生物学功能研究提供了重要参考。
关键词萝卜    TALE基因家族    基因结构    进化分析    组织表达    
Identification and analysis of the TALE transcription factor family in radish
ZHAO Wei , LI Xixiang , WANG Haiping , JIA Huixia , SONG Jiangping , YANG Wenlong , ZHANG Xiaohui     
Beijing Research Station of Vegetable Crop Gene Resource and Germplasm Enhancement, Ministry of Agriculture and Rural Affairs of People's Republic of China, Key Laboratory of Biology and Genetic Improvement of Horticultural Crops, Ministry of Agriculture and Rural Affairs of People's Republic of China, Institute of Vegetables and Flowers, Chinese Academy of Agriculture Sciences, Beijing 100081, China
Abstract: Three-amino acid loop extension (TALE) transcription factors play important roles in plant growth and cell differentiation. There are plenty of studies on TALE transcription factors in several model plants, but not in radish (Raphanus sativas). A genome-wide bioinformatics analysis identified 33 TALE family genes in the Xiang-Ya-Bai (XYB) radish, These genes, are distributed on nine chromosomes and all contain 4-6 exons. The 33 TALE genes in radish showed a co-linearity relationship with the 17 homologous genes in Arabidopsis thaliana. Moreover, a large number of stress response cis-elements were found in the promoter regions of these genes. Expression analysis showed that four genes in the BELL subfamily were highly expressed in roots, and two genes in the KNOX subfamily were highly expressed in shoots of bolting plants and callus. All radish TALE genes contain sequences encoding the conserved HOX domain, except for the gene RSA10037940, which is homologous to Arabidopsis KNATM. The deduced 3D structures of the TALE proteins irrespective of subtypes are highly similar. All the encoded proteins were weakly acidic and hydrophilic. The radish TALE gene family is relatively evolutionarily conserved, which was consistent with results from Arabidopsis, but quite different from that of rice. This study provides important clues for studying the biological functions of TALE transcription factors in radish.
Keywords: Raphanus sativus    TALE gene family    gene structure    evolutionary analysis    tissue expression    

同源异型盒(Homeobox) 基因是指能够编码产生保守同源异型盒结构域的转录因子编码基因。一个典型的同源异型结构域由60个氨基酸组成,60个氨基酸形成了3个螺旋区域,第一和第二螺旋形成环状结构,第二和第三螺旋形成螺旋-角-螺旋的结构[1]Homeobox基因最早发现于果蝇的第3条染色体上,随后证实该类基因广泛存在于动物和植物中,果蝇的Antp基因和玉米的Knotted-1基因分别为动物和植物中最早被克隆的基因。在植物中,根据结构特征可将Homeobox转录因子家族成员分为14类:HD-ZIPⅠ、HD-ZIPⅡ、HD-ZIPⅢ、HD-ZIPⅣ、PLINC、WOX、DDT、PHD、NDX、LD、PINTOX、SAWADEE、KNOX和BELL;在PlantTFDB中,Homeobox转录因子家族被分为5个家族:HD‐ZIP、TALE、WOX、HB-PHD和HB-other[2]。其中,TALE转录因子家族包含KNOX亚家族和BELL亚家族,编码1个由63个氨基酸组成的非典型同源结构域,额外的3个氨基酸(P, Y, P) 残基连接在第一螺旋区域和第二螺旋区域之间。KNOX蛋白基本包含KNOX1、KNOX2、ELK和Homeodomain 4个结构域,拟南芥中KNATM蛋白不含Homeodomain结构域但属于KNOX家族。研究表明,含KNOX1结构域的基因在分生组织中表达,对于分生组织的发育起着重要作用;含KNOX2结构域的基因在调控植物细胞壁的次生生长以及根、茎、种皮、心材的发育方面发挥重要作用[3]。BELL蛋白包含POX和Homeodomain 2个结构域,在胚珠发育、叶柄发育和果实形成过程中起着重要作用[4]

随着生物信息学和植物全基因组测序的快速发展,杨树[5]、辣椒[6]、百脉根[7]、亚洲棉[8]等物种基因组中分别鉴定到35、20、40、46个TALE转录因子家族成员。杨树TALE转录因子家族成员中发现了11个盐胁迫响应基因,其中ptTALE5经过胁迫处理后上调表达,可能在应对盐胁迫中具有重要功能。辣椒TALE转录因子家族各亚族之间保守基序几乎完全一致,表明辣椒TALE转录因子家族进化过程高度保守。百脉根中鉴定出的TALE转录因子家族成员存在多条结构域缺失的序列,表明百脉根在进化过程中出现假基因化现象,可能某些基因会出现功能缺失。亚洲棉TALE转录因子家族的研究中发现部分TALE成员在棉纤维次生细胞壁(secondary cell wall, SCW)增厚期表达,为进一步了解纤维SCW生物合成网络提供了线索。

萝卜(Raphanus sativas)属于十字花科萝卜属,是重要的蔬菜作物。研究萝卜TALE转录因子的功能和调控机制有助于萝卜的功能基因组研究和分子育种。本研究以象牙白萝卜为实验材料,在全基因组范围内识别和鉴定了TALE基因家族成员,并对其基因结构、在基因组中的位置、与近缘植物中同源基因的共线性关系、启动子区顺式作用元件、组织表达特征、编码蛋白的理化性质和模拟蛋白质结构、系统发育关系等进行分析,研究结果将为萝卜TALE转录因子的生物学功能解析提供有用信息。

1 材料与方法 1.1 数据来源

通过植物转录因子数据库(PlantTFDB,http://planttfdb.cbi.pku.edu.cn/) 下载萝卜(Raphanus sativus)、拟南芥(Arabidopsis thaliana)、水稻(Oryza sativa subsp. japonica) 和胡杨(Populus euphratica) 的TALE转录因子信息,象牙白萝卜全基因组测序由中国农业科学院蔬菜花卉研究所等单位协作完成[9]

1.2 萝卜TALE基因家族的鉴定

本研究从PlantTFDB4.0中下载得到萝卜TALE转录因子蛋白序列,利用在线工具ClustalW进行多序列比对获得ALN格式文件,通过Hmmbuild软件自制萝卜的隐马尔可夫模型(hidden markov model, HMM),之后利用Hmmsearch软件在象牙白萝卜中比对搜索E值小于1e-10的所有蛋白序列。并利用NCBI网站(https://www.ncbi.nlm.nih.gov/)的Batch-CD-search工具复筛含有完整BELL、KNOX结构域的萝卜TALE家族蛋白序列。利用TBtools[10] (https://github.com/CJ-Chen/TBtools) 进行保守结构域可视化。

1.3 萝卜TALE基因家族序列结构分析

根据鉴定得到的TALE基因家族成员及基因结构注释文件,利用TBtools中gene structure view (advanced) 分析其基因结构。利用MEME (http://meme-suite.org/index.html)对TALE基因家族氨基酸序列保守域和结构元件进行分析,基序数量寻找10个。

1.4 TALE基因家族染色体定位与直系同源关系

根据鉴定出的象牙白萝卜TALE基因家族成员信息及象牙白萝卜基因结构注释信息文件,利用TBtools中的gene location visualize from GTF/GFF功能进行TALE基因家族的染色体定位。结合拟南芥和象牙白萝卜的基因结构注释信息文件及基因组文件,使用TBtools中的One step MCScanX功能得到萝卜与拟南芥直系同源基因信息,以‘36-2-R0N’表示序列所定位的萝卜染色体号,N(包括0-9)为染色体编号,以‘AT-ChrN’表示序列所定位的拟南芥染色体号,N(包括0-5)为染色体编号。使用TBtools软件dual systeny plot功能绘制萝卜与拟南芥的直系同源基因图。

1.5 萝卜TALE基因家族启动子顺式作用元件分析

通过PlantCARE网站(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/) 的‘search for care’工具进行TALE基因起始密码子上游2 000 bp区域的顺式作用元件预测,最后利用TBtools的simple bioSequence viewer功能对生成的结果进行可视化分析。

1.6 萝卜TALE家族基因表达特性分析

TALE基因家族表达分析使用的转录组数据由本实验室测序完成。转录组数据包括‘象牙白’萝卜愈伤、肉质根、叶、薹、花、角果6个组织及‘心里美’萝卜肉质根芽期、破肚期、肉质根膨大前期、膨大盛期、成熟期5个发育时期[11]。表达量经过log2(RPKM) 标准化处理,利用TBtools软件绘制热图[12]

1.7 萝卜TALE家族蛋白的理化性质与三维结构分析

蛋白长度、分子质量、等电点和亲水性等理化性质的分析通过在线工具ExPASy (https://web.expasy.org/protparam/) 完成;信号肽的判断分析通过在线工具SignalP4.1Sever (http://www.cbs.dtu.dk/services/SignalP/) 完成;亚细胞定位预测通过在线工具wolfpsort (https://wolfpsort.hgc.jp/) 完成;蛋白三维结构建模分析通过在线工具SWISS MODEL (https://swissmodel.expasy.org/interactive) 完成。

1.8 萝卜TALE基因家族系统进化分析

采用MEGA-X软件构建TALE基因家族系统进化树,构建模型选择邻接法(neighbor-joining),利用bootstrap method和pairwise deletion,重复次数设置为1 000。使用在线工具iTOL (https://itol.embl.de/)[13]美化系统进化树。

2 结果与分析 2.1 萝卜TALE转录因子家族成员的筛选与鉴定

经Hmmsearch程序检索及Batch-CD-search工具复筛,在象牙白萝卜43 239条氨基酸序列中找到32条符合条件的序列,加上一条和拟南芥KNATM同源的氨基酸序列Rsa10037940,象牙白萝卜中共得到33条TALE氨基酸序列。除蛋白Rsa10037940外,这些氨基酸序列均含有1个保守的Homeobox-KN结构域。33条TALE氨基酸序列根据结构域的差异可以分为BELL和KNOX 2个亚家族。象牙白萝卜BELL亚族包含21个成员,其中17个成员含有POX、Homeobox-KN结构域,4个成员含有POX-superfamily、Homeobox-KN结构域。象牙白萝卜KNOX亚族包含12个成员,其中7个成员含有KNOX2、KNOX1,Homeobox-KN、ELK结构域,2个成员含有KNOX2、KNOX1、Homeobox-KN结构域,成员Rsa10036281含有KNOX2-superfamily、ELK、Homeobox-KN结构域,成员Rsa10019161除了含有KNOX2、KNOX1、Homeobox-KN 3种结构域之外,还含有Neurochodrin结构域,成员Rsa10037940仅含有KNOX2-superfamily结构域(图 1)。

图 1 萝卜TALE家族蛋白保守结构域 Fig. 1 The conserved domain of the TALE family protein in radish.
2.2 萝卜TALE家族转录因子的蛋白结构分析

使用MEGA-X构建象牙白萝卜TALE家族氨基酸序列的系统进化树显示(图 2A),33条萝卜TALE家族蛋白可以分为8个类群:KNOX亚族分为3个类群,BELL亚族分成5个类群。设置基序数量为10,利用MEME在线工具对萝卜TALE家族氨基酸序列进行分析发现,不同的氨基酸序列包含的motif数量从4–8个不等(图 2B)。除氨基酸序列Rsa10037940外,其他家族成员均含有motif1、motif3保守基序,说明motif1、motif3基序保守性最强,对应结构域为Homeobox-KN结构域。除了共有基序motif1、motif3外,KNOX亚家族motif5保守,POX亚家族motif4保守,各亚家族的独特保守基序可能与各亚家族的不同功能相关。

图 2 萝卜TALE家族成员基因结构和保守基序 Fig. 2 Gene structure and conserved motif of the TALE family members in radish genome. (A) Phylogenetic tree. (B) Gene structure. (C) Conserved motifs.
2.3 萝卜TALE家族基因结构分析

在象牙白萝卜基因组中提取编码这些转录因子的基因,发现TALE家族的基因序列结构差异较大(图 2C),Rsa10008122序列最长,为14 199 bp;Rsa10036281序列最短,仅1 031 bp。各亚族之间内含子数目变化具有一定的规律性,BELL亚族成员之间内含子个数在2–4之间,KNOX亚族成员之间内含子个数在3–5之间。家族成员中除了Rsa10037940Rsa10038304Rsa10030646Rsa10020180Rsa10037078Rsa10017083Rsa10008122Rsa10033513Rsa10037168等序列含有5′UTR或3′UTR外,其他成员均不含5′UTR和3′UTR。序列含有5′UTR和3′UTR对于mRNA的稳定性有重要作用,这些没有UTR的基因可能是没有注释出来,而非真的没有UTR。

2.4 萝卜全基因组TALE基因染色体定位以及与近缘物种的直系同源关系

TALE家族基因在象牙白萝卜基因组9条染色体上均有分布,从Chr1至Chr9分别有3、7、3、7、1、3、3、2和3个基因(图 3)。象牙白萝卜与拟南芥TALE基因家族成员共线性分析发现,象牙白萝卜中30个TALE基因和拟南芥中17个TALE基因互为直系同源基因。在拟南芥3号染色体上没有直系同源基因分布。其中象牙白萝卜和拟南芥TALE家族基因中互为同源基因的对应关系见表 1图 4

图 3 TALE基因家族成员在萝卜染色体上的分布 Fig. 3 Distribution of TALE family genes on radish chromosomes.
表 1 萝卜拟南芥同源基因共线性关系 Table 1 Co-linearity of the homologous genes in radish and Arabidopsis
AT-chromosome distribution AT-gene ID 36-2-chromosome distribution 36-2-gene ID
AT-Chr1 AT-AT1G14760.1 == 36-2-R06 36-2-Rsa10037940
AT-Chr1 AT-AT1G19700.1 == 36-2-R08 36-2-Rsa10040799
AT-Chr1 AT-AT1G62360.1 == 36-2-R09 36-2-Rsa10033559
AT-Chr1 AT-AT1G62990.1 == 36-2-R09 36-2-Rsa10033513
36-2-R09 36-2-Rsa10033302
AT-Chr1 AT-AT1G70510.1 == 36-2-R02 36-2-Rsa10008122
36-2-R06 36-2-Rsa10040100
AT-Chr1 AT-AT1G75410.1 == 36-2-R02 36-2-Rsa10030646
36-2-R07 36-2-Rsa10023553
36-2-R07 36-2-Rsa10034187
AT-Chr2 AT-AT2G16400.1 == 36-2-R04 36-2-Rsa10037168
36-2-R05 36-2-Rsa10041765
AT-Chr2 AT-AT2G23760.1 == 36-2-R01 36-2-Rsa10023144
36-2-R04 36-2-Rsa10002699
AT-Chr2 AT-AT2G27220.2 == 36-2-R04 36-2-Rsa10020180
AT-Chr2 AT-AT2G35940.1 == 36-2-R01 36-2-Rsa10038773
36-2-R03 36-2-Rsa10017083
36-2-R04 36-2-Rsa10020487
AT-Chr4 AT-AT4G08150.1 == 36-2-R03 36-2-Rsa10021426
AT-Chr4 AT-AT4G32040.1 == 36-2-R01 36-2-Rsa10019760
36-2-R02 36-2-Rsa10019161
36-2-R04 36-2-Rsa10037047
AT-Chr4 AT-AT4G32980.1 == 36-2-R02 36-2-Rsa10002437
== == 36-2-R04 36-2-Rsa10037078
  AT-Chr4 AT-AT4G36870.1 36-2-R02 36-2-Rsa10026407
  AT-Chr5 AT-AT5G02030.1 == 36-2-R02 36-2-Rsa10008744
36-2-R07 36-2-Rsa10007991
AT-Chr5 AT-AT5G11060.1 == 36-2-R02 36-2-Rsa10025037
AT-Chr5 AT-AT5G41410.1 == 36-2-R03 36-2-Rsa10036281
36-2-R04 36-2-Rsa10035441
图 4 萝卜拟南芥同源基因共线性关系 Fig. 4 Co-linearity of homologous genes in radish and Arabidopsis. The gray line represents the collinear block between the radish genome and the Arabidopsis genome, and the red line represents the positions of each TALE gene in the collinear block. 灰色线代表萝卜基因组与拟南芥基因组之间的共线性区块,红色线代表共线性区块中各TALE基因的位置

萝卜和拟南芥同为十字花科植物,亲缘关系较近,因此具有保守性较好的共线性区块。推测在进化过程中染色体水平上发生的融合、断裂,改变了萝卜和拟南芥基因的相对物理位置,甚至造成了2个物种染色体数目的变化,但是家族基因所在位置的共线性排列依旧保守。除个别TALE家族基因外,萝卜TALE家族基因与拟南芥TALE家族基因有一对多的共线性关系,这一结果与萝卜在与拟南芥分化之后基因组发生过三倍化事件这一理论相吻合。

2.5 萝卜TALE基因家族启动子特征分析

萝卜TALE基因家族启动子特征分析表明,其成员上游2 000 bp区域存在大量对赤霉素、生长素、低温、水杨酸、干旱诱导、脱落酸、茉莉酸甲酯响应的顺式元件(图 5)。其中,Rsa10040100启动子上只有1个脱落酸响应元件。66.7%的成员包含茉莉酸甲酯响应元件,81.8%的成员包含脱落酸响应元件,45.5%的成员包含干旱诱导的MYB结合元件,60.6%的成员包含生长素响应元件,30.3%的成员包含低温响应元件,63.6%的成员包含水杨酸响应元件,36.4%的成员包含赤霉素响应元件。

图 5 TALE基因家族启动子顺式作用元件分布图 Fig. 5 Cis-acting element distribution in the promoters of the TALE genes.
2.6 萝卜TALE家族基因的表达特性分析

基于转录组数据对萝卜TALE基因家族成员的表达特性进行分析(图 6)。结果显示,TALE基因家族成员在萝卜不同组织(肉质根、薹、愈伤、花、叶片、角果) 中表达量存在较大差异,Rsa10026944Rsa10026407在各组织中均高表达,Rsa10002437在各组织中的表达量均较低;Rsa10037047在薹中表达量较高,Rsa10025037在愈伤组织中表达量较高;KNOX亚族成员在不同组织间的表达量比较均一。

图 6 萝卜不同组织中TALE基因的差异表达 Fig. 6 Expression of TALE genes in different tissues of radish.

对萝卜TALE家族基因在‘心里美’萝卜肉质根5个发育时期中的表达量进行分析(图 7),发现Rsa10038773Rsa10017083Rsa10020487Rsa10021426这4个基因在心里美材料的肉质根的5个不同发育时期中,都具有较高的表达量。Rsa10020180在心里美萝卜的5个生长时期呈现出表达量由低到高的表达趋势。

图 7 萝卜肉质根不同时期TALE基因的差异表达 Fig. 7 Expression of TALE genes in radish roots at different stages.
2.7 萝卜TALE基因家族蛋白的三维结构与理化性质分析

植物蛋白质的高级结构决定其生物学功能及活性大小。对象牙白萝卜33个TALE基因家族成员进行蛋白三维结构建模分析,28条氨基酸序列搜索到了相似度大于30%的模板,其氨基酸三维结构表明不同亚型成员的蛋白3D结构具有高度的相似性。结构的主要成分为3个α-螺旋。β-折叠与β-转角散布于整个蛋白序列中(图 8)。另外5个蛋白质的结构可信度低,本研究未采纳其预测的结构。如大小差异较大的Rsa10037940和Rsa10019161等蛋白质。

图 8 萝卜TALE家族成员三维结构 Fig. 8 3D structure of TALE family members in radish.

利用生物信息学方式对TALE基因家族编码蛋白进行分析,结果表明该家族蛋白长度变化范围为139 aa (Rsa10037940) 到995 aa (Rsa10019161);蛋白分子量最大的为110 116.7 Da (Rsa10019161),最小的为15 868.86 Da (Rsa10037940)。该家族蛋白除Rsa10002699、Rsa10007991、Rsa10020180以外均为酸性蛋白,等电点小于7。亲水性分析表明,该家族蛋白均为亲水蛋白,平均亲水性(GRAVY) 均为负值。该家族成员均检测不到信号肽,表明它们可能没有跨膜运输功能。亚细胞定位网站分析结果显示,33个编码蛋白均定位在细胞核,这也与转录因子定位在细胞核调控基因表达的功能相吻合(表 2)。

表 2 萝卜TALE基因家族成员 Table 2 Members of TALE gene family in radish
Genes ID Domains Length of aa Molecular weight Isoelectric point Hydrophilic/ hydrophobicity property Sub-cellular localization Homologue of At AtTALE names
Rsa10023553 POX, Homeobox_KN 469 53 356.66 5.99 –0.94 nucl AT1G75410 BLH3
Rsa10030646 POX, Homeobox_KN 499 56 885.91 6.73 –0.93 nucl AT1G75410 BLH3
Rsa10034188 POX, Homeobox_KN 506 57 467.43 6.48 –0.92 nucl AT1G75410 BLH3
Rsa10038304 POX, Homeobox_KN 496 56 562.60 6.14 –0.89 nucl AT1G19700 BEL10
Rsa10040799 POX, Homeobox_KN 467 53 156.16 6.66 –0.86 nucl AT1G19700 BEL10
Rsa10035441 POX, Homeobox_KN 594 67 209.75 6.67 –0.82 nucl AT5G41410 BEL1
Rsa10026944 POX, Homeobox_KN 669 73 940.62 6.66 –0.76 nucl AT4G36870 BLH2
Rsa10038773 POX, Homeobox_KN 663 73 247.31 6.87 –0.75 nucl AT2G35940 BLH1
Rsa10026407 POX, Homeobox_KN 638 70 026.40 6.46 –0.71 nucl AT4G36870 BLH2
Rsa10020487 POX, Homeobox_KN 674 73 376.10 6.44 –0.71 nucl AT2G35940 BLH1
Rsa10037168 POX, Homeobox_KN 533 59 793.70 5.85 –0.70 nucl AT4G34610 BLH6
Rsa10017083 POX, Homeobox_KN 668 73 084.08 6.63 –0.67 nucl AT2G35940 BLH1
Rsa10041765 POX, Homeobox_KN 450 50 063.97 5.92 –0.59 nucl AT2G16400 BLH7
Rsa10002437 POX, Homeobox_KN 462 52 582.17 6.23 –0.58 nucl AT4G32980 ATH1
Rsa10007991 POX, Homeobox_KN 580 62 454.19 7.41 –0.48 nucl AT5G02030 BLH9
Rsa10008744 POX, Homeobox_KN 564 60 716.34 6.91 –0.43 nucl AT5G02030 BLH9
Rsa10034187 POX, Homeobox_KN 290 33 001.48 5.67 –0.34 nucl AT1G75430 BLH11
Rsa10037078 POX superfamily, Homeobox_KN 452 51 406.73 5.99 –0.53 nucl AT4G32980 ATH1
Rsa10002699 POX superfamily, Homeobox_KN 644 71 141.55 7.17 –0.80 nucl AT2G23760 BLH4
Rsa10023144 POX superfamily, Homeobox_KN 564 62 102.09 6.15 –0.80 nucl AT2G23760 BLH4
Rsa10020180 POX superfamily, Homeobox_KN 394 44 164.97 8.59 –0.54 nucl AT2G27220 BLH5
Rsa10021426 KNOX1, KNOX2, ELK, Homeobox_KN 389 44 852.90 6.09 –1.06 nucl AT4G08150 KNAT1
Rsa10036281 KNOX2 superfamily, ELK, Homeobox_KN 173 19 854.21 6.45 –0.98 nucl AT5G11060 KNAT4
Rsa10025037 KNOX1, KNOX2, ELK, Homeobox_KN 396 44 754.73 6.29 –0.80 nucl AT5G11060 KNAT4
Rsa10037047 KNOX1, KNOX2, ELK, Homeobox_KN 372 42 046.88 5.95 –0.78 nucl AT4G32040 KNAT5
Rsa10033559 KNOX1, KNOX2, ELK, Homeobox_KN 284 32 277.55 6.13 –0.67 nucl AT1G62360 STM
Rsa10019760 KNOX1, KNOX2, ELK, Homeobox_KN 305 33 869.99 5.69 –0.64 nucl AT5G25220 KNAT3
Rsa10008122 KNOX1, KNOX2, ELK, Homeobox_KN 326 36 911.22 4.86 –0.64 nucl AT1G70510 KNAT1
Rsa10033302 KNOX1, KNOX2, Homeobox_KN 292 32 865.06 6.10 –0.61 nucl AT1G62990 KNAT7
Rsa10033513 KNOX1, KNOX2, Homeobox_KN 291 33 014.45 6.27 –0.56 nucl AT1G62990 KNAT7
Rsa10040100 KNOX1, KNOX2, ELK, Homeobox_KN 330 36 914.56 4.89 –0.53 nucl AT1G23380 KNAT6
Rsa10019161 KNOX1, KNOX2, Homeobox_KN, Neurochondrin 995 110 116.70 5.23 –0.14 nucl AT4G32040 KNAT5
Rsa10037940 KNOX2 superfamily 139 15 868.86 4.82 –0.59 nucl AT1G14760 KNATM
2.8 萝卜TALE转录因子家族进化关系

构建系统发育进化树对于基因功能分析十分重要。利用氨基酸序列构建萝卜、拟南芥、水稻和胡杨的NJ系统发育树(图 9),结果显示在4个物种中TALE转录因子家族可以被划分为Class Ⅰ–Ⅷ共8组。其中Class Ⅰ、Class Ⅱ、Class Ⅲ为KNOX亚族,Class Ⅳ、Class Ⅴ、Class Ⅵ、Class Ⅶ、Class Ⅷ为BELL亚族。同一分组TALE转录因子家族氨基酸序列亲缘关系较近,其中Class Ⅰ TALE转录因子家族成员数量最多,有31个;Class Ⅲ TALE转录因子家族成员数量最少,含有7个。由图可以看出萝卜和拟南芥的TALE氨基酸序列总是聚在一起,同源性最高,其次是胡杨,水稻TALE氨基酸序列进化树距离最远,有1个KNOX亚族成员和3个BELL亚族成员游离在双子叶植物的8个分支之外,表明这些基因在单、双子叶植物中产生了独立的进化方向。TALE转录因子家族内各亚族数量关系上,拟南芥和萝卜KNOX亚族成员数量均少于BELL亚族成员数量,但是胡杨和水稻KNOX亚族成员数量均多于BELL亚族成员数量,表明不同物种间TALE转录因子家族之间系统进化方向并不相同。

图 9 不同物种TALE转录因子家族成员进化树 Fig. 9 Phylogenetic tree of TALE transcription factors from different species. At: Arabidopsis thaliana; Rsa: Raphanus sativus; CCG: Populus euphratica; LOC: Oryza sativa.
3 讨论

TALE转录因子的结构域有KNOX、BELL、Homeodomain 3种,在调控植物生长发育、分生组织形成和维持器官形态发生方面发挥重要作用[14]。KNOX结构域对于顶端分生组织的调控和激素的合成途径有重要作用,研究发现,赤霉素合成途径中的关键酶基因GA20ox1可以被KNOX结构域抑制表达[15]。BELL蛋白与KNOX蛋白总是形成异二聚体发挥作用,BELL蛋白调控分生组织和花的发育,但其功能冗余[16]

本研究通过对象牙白萝卜TALE基因家族的检索与筛选,在象牙白萝卜中共鉴定到了33个TALE基因家族成员。其基因差异表达分析发现BELL亚族的Rsa10026944Rsa10026407Rsa10037168Rsa10041765主要在肉质根表达。Rsa10026944Rsa10026407在家族成员氨基酸序列进化关系中处于Class Ⅵ,Rsa10026407Rsa10037168在家族成员氨基酸序列进化关系中处于Class Ⅳ。Rsa10026944Rsa10026407与拟南芥对应的同源基因为BLH2,其在种子粘液分泌细胞中显著表达,与种子萌发和幼苗早期发育有关[17]Rsa10037168与拟南芥对应的同源基因为BLH6,研究证明BLH6BREVIPEDICELLUS之间存在相互作用的关系,共同调控根和茎的发育[18]。而KNOX亚族的Rsa10037047Rsa10025037主要在薹和愈伤组织中表达。Rsa10037047Rsa10025037与拟南芥对应的同源基因分别为KNAT4KNAT5,研究表明,KNAT4KNAT5在拟南芥根中具有细胞型特异性表达模式。此外,它们沿纵根轴和内根原基的表达具有不同的空间限制模式[19]。水稻胚胎发生过程中KNOX基因在茎间分生组织区域表达,表明这些基因参与了茎间分生形成的调节[20]。目前关于TALE基因组织表达的研究表明:BLH1与种子萌发和幼苗早期发育有关[21]BLH4调控叶形发育[16]BLH8在营养体向生殖体过渡过程中起着重要作用[22]BLH9调控花序茎的生长[23]KNAT6参与分生组织活性和器官分离[24]KNAT7与次生壁的形成有关[25]

萝卜和拟南芥的共线性分析发现,萝卜TALE家族30条基因序列与拟南芥中17条TALE基因序列具有共线性,多数萝卜TALE家族基因与拟南芥TALE家族基因有一对多的共线性关系,表明萝卜与拟南芥基因组分化后发生过基因家族复制事件,Rsa10034188未在拟南芥中发现共线性基因。表明萝卜TALE家族成员在物种分化后进化出新的功能。

分析TALE家族成员的氨基酸序列进化关系、基因序列结构和氨基酸保守基序发现,系统发育进化树中关系紧密的成员外显子长度相似。含有相似基因结构的家族成员氨基酸保守基序也相似。TALE转录因子家族蛋白Homeobox-KN结构域具有较强保守性,可作为后续功能验证的靶向序列。Rsa10037940不含Homeobox-KN保守结构域,表明此基因在进化过程中结构域发生了丢失,基因功能也可能发生了改变。在萝卜TALE家族成员中Rsa10008122存在1个约8 kb的5′UTR;Rsa10019161除了含有KNOX保守结构域还多出来1个Neurochondrin结构域,经过和WK10039萝卜(SAMN03084390) 基因组注释文件的比对,发现Rsa10008122Rsa10019161的序列在萝卜WK10039基因组(SAMN03084390) 中分别被注释成2个基因,Rsa10008122中约8 kb的5′UTR在WK10039萝卜基因组中被单独注释成一个基因,Rsa10019161中多出来的结构域也被单独注释成一个基因,表明Rsa10008122在象牙白萝卜基因组或WK10039萝卜基因组中有一个可能存在注释错误或拼接错误。

根据基因结构,将萝卜TALE家族成员的氨基酸序列分成了8类,其中KNOX亚族分为3类,BELL亚族分为5类,据报道,拟南芥、棉花、石榴、杨树等植物的TALE家族氨基酸序列分类情况与此一致[26],表明植物中TALE基因家族序列保守性较强。拟南芥、萝卜、水稻、杨树4种植物的TALE蛋白系统进化分析中,BELL和KNOX亚家族分支明显,表明氨基酸序列上差异较大,可能2个亚家族分化时间较早。萝卜和拟南芥在分化上存在一致性,可能由于两者都属于十字花科,亲缘关系较近。萝卜和水稻在分化上差异较大,可能由于单双子叶植物在进化方向上有所不同。

启动子区域的顺式元件分析发现,TALE基因启动子序列包含多个与激素反应和非生物胁迫相关的顺式元件。富含茉莉酸甲酯、脱落酸、水杨酸、赤霉素、生长素、低温诱导、干旱胁迫等响应元件,表明萝卜TALE基因与逆境胁迫调控有关[27]。这些结果与石榴[26]、棉花[8]等研究结果类似,说明TALE基因启动子具有一定的保守性。

邓浪等发现信号肽与蛋白质定向转运功能有关[28],信号肽分析表明,萝卜中TALE基因家族蛋白不参与细胞中蛋白质定向转运活动。蛋白理化性质分析表明,萝卜TALE基因家族蛋白的分子质量和氨基酸数量差异较大,表明TALE基因家族对于萝卜的调控方式可能更为复杂,调控效果更加多样。

目前,TALE基因家族已在多种植物中被鉴定出来,但是关于萝卜TALE基因家族的鉴定仍未见报道,本研究利用生物信息学手段在象牙白萝卜中鉴定出了33个TALE基因家族成员,研究了其理化性质及系统分化特点,并结合转录组数据对基因表达特性也进行了分析,萝卜TALE基因家族的鉴定及分析有助于后续对其成员的功能进行深入研究。

参考文献
[1]
Billeter M, Qian YQ, Otting G, et al. Determination of the nuclear magnetic resonance solution structure of an antennapedia homeodomain-DNA complex. J Mol Biol, 1993, 234(4): 1084-1097. DOI:10.1006/jmbi.1993.1661
[2]
Jin J, Feng T, De-Chang Y, et al. PlantTFDB 4.0: toward a central hub for transcription factors and regulatory interactions in plants. Nucleic Acids Res, 2017, D1040-D1045.
[3]
Magnani E, Hake S. KNOX lost the OX: the Arabidopsis KNATM gene defines a novel class of KNOX transcriptional regulators missing the homeodomain. Plant Cell, 2008, 20(4): 875-887. DOI:10.1105/tpc.108.058495
[4]
Meng L, Fan Z, Zhang Q, et al. BEL1-LIKE HOMEODOMAIN 11 regulates chloroplast development and chlorophyll synthesis in tomato fruit. Plant J, 2018, 94(6): 1126-1140. DOI:10.1111/tpj.13924
[5]
Zhao K, Zhang X, Cheng Z, et al. Comprehensive analysis of the three-amino-acid-loop-extension gene family and its tissue-differential expression in response to salt stress in poplar. Plant Physiol Biochem, 2019, 136: 1-12. DOI:10.1016/j.plaphy.2019.01.003
[6]
张中荣, 吉雪花, 张海英, 等. 辣椒TALE转录因子的生物信息学分析. 分子植物育种, 2020, 18(5): 1401-1408.
Zhang ZR, Ji XH, Zhang HY, et al. Bioinformatics analysis of TALE transcription factors in pepper. Mol Plant Breed, 2020, 18(5): 1401-1408 (in Chinese).
[7]
丘日光, 张天缘, 杨仕梅, 等. 百脉根TALE转录因子家族的鉴定与生物信息学分析. 植物遗传资源学报, 2019, 20(2): 466-475.
Qiu RG, Zhang TY, Yang SM, et al. Genome-wide identification and bioinformatics analysis of TALE transcription factor family in Lotus japonicus.. J Plant Genet Resour, 2019, 20(2): 466-475 (in Chinese).
[8]
Ma Q, Wang N, Hao P, et al. Genome-wide identification and characterization of TALE superfamily genes in cotton reveals their functions in regulating secondary cell wall biosynthesis. BMC Plant Biol, 2019, 19(1): 432. DOI:10.1186/s12870-019-2026-1
[9]
Zhang XH, Yue Z, Mei SY, et al. A de novo genome of a Chinese radish cultivar. Hortic Plant J, 2015, 1(3): 155-164.
[10]
Chen C, Chen H, Zhang Y, et al. TBtools: an integrative toolkit developed for interactive analyses of big biological data. Mol Plant, 2020, 13(8): 1194-1202. DOI:10.1016/j.molp.2020.06.009
[11]
Sun Y, Wang J, Qiu Y, et al. Identification of 'Xinlimei' radish candidate genes associated with anthocyanin biosynthesis based on a transcriptome analysis. Gene, 2018, 657: 81-91. DOI:10.1016/j.gene.2018.03.001
[12]
刘婷婷, 李晓曼, 张晓辉, 等. 萝卜全基因组中SPL基因家族成员的鉴定与分析. 植物遗传资源学报, 2021, 22(4): 1145-1156.
Liu TT, Li XM, ZHang XH, et al. Genome-wide identification and analysis of SPL gene family in radish. J Plant Genet Resour, 2021, 22(4): 1145-1156 (in Chinese).
[13]
Letunic I, Bork P. Interactive tree of life (iTOL) v3: an online tool for the display and annotation of phylogenetic and other trees. Nucleic Acids Res, 2016, 44(w1): W242-W245. DOI:10.1093/nar/gkw290
[14]
Shani E, Yanai O, Ori N. The role of hormones in shoot apical meristem function. Curr Opin Plant Biol, 2006, 9(5): 484-489. DOI:10.1016/j.pbi.2006.07.008
[15]
Chen H, Banerjee AK, Hannapel DJ. The tandem complex of BEL and KNOX partners is required for transcriptional repression of ga20ox1. Plant J, 2004, 38(2): 276-284. DOI:10.1111/j.1365-313X.2004.02048.x
[16]
Kumar R, Kushalappa K, Godt D, et al. The Arabidopsis BEL1-LIKE HOMEODOMAIN proteins SAW1 and SAW2 act redundantly to regulate KNOX expression spatially in leaf margins. Plant Cell, 2007, 19(9): 2719-2735. DOI:10.1105/tpc.106.048769
[17]
Xu Y, Wang Y, Wang X, et al. Transcription factors BLH2 and BLH4 regulate demethylesterification of homogalacturonan in seed mucilage. Plant Physiol, 2020, 183(1): 96-111. DOI:10.1104/pp.20.00011
[18]
Souček P, Hanáček P, Mazura P, et al. Interaction among BREVIPEDICELLUS, BLH6 and auxin in roots of Arabidopsis thaliana. Russ J Plant Physiol, 2017, 64(3): 386-397. DOI:10.1134/S1021443717030189
[19]
Truernit E, Siemering KR, Hodge S, et al. A map of KNAT gene expression in the Arabidopsis root. Plant Mol Biol, 2006, 60(1): 1-20. DOI:10.1007/s11103-005-1673-9
[20]
Postma-Haarsma AD, Verwoert Ⅱ, Stronk OP, et al. Characterization of the KNOX class homeobox genes Oskn2 and Oskn3 identified in a collection of cDNA libraries covering the early stages of rice embryogenesis. Plant Mol Biol, 1999, 39(2): 257-271. DOI:10.1023/A:1006153506868
[21]
Kim D, Cho YH, Ryu H, et al. BLH1 and KNAT3 modulate ABA responses during germination and early seedling development in Arabidopsis. Plant J, 2013, 75(5): 755-766. DOI:10.1111/tpj.12236
[22]
Smith HMS, Campbell BC, Hake S. Competence to respond to floral inductive signals requires the homeobox genes pennywise and pound-foolish. Curr Biol, 2004, 14(9): 812-817. DOI:10.1016/j.cub.2004.04.032
[23]
Bhatt AM, Etchells JP, Canales C, et al. VAAMANA—a BEL1-like homeodomain protein, interacts with KNOX proteins BP and STM and regulates inflorescence stem growth in Arabidopsis. Gene, 2004, 328: 103-111. DOI:10.1016/j.gene.2003.12.033
[24]
Belles-Boix E, Hamant O, Witiak SM, et al. KNAT6: An Arabidopsis homeobox gene involved in meristem activity and organ separation. Plant Cell, 2006, 18(8): 1900-1907. DOI:10.1105/tpc.106.041988
[25]
Li E, Bhargava A, Qiang W, et al. The Class Ⅱ KNOX gene KNAT7 negatively regulates secondary wall formation in Arabidopsis and is functionally conserved in Populus. New Phytol, 2012, 194(1): 102-115. DOI:10.1111/j.1469-8137.2011.04016.x
[26]
Wang YY, Zhao YJ, Yan M, et al. Genome-wide identification and expression analysis of TALE gene family in pomegranate (Punica granatum L.). Agronomy, 2020, 10(6): 829. DOI:10.3390/agronomy10060829
[27]
Michelmore RW, Meyers BC. Clusters of resistance genes in plants evolve by divergent selection and a birth-and-death process. Genome Res, 1998, 8(11): 1113-1130. DOI:10.1101/gr.8.11.1113
[28]
邓浪, 沈兵琪, 王连春, 等. '红阳'猕猴桃全基因组AP2/EREBP转录因子生物信息学分析. 果树学报, 2017, 34(7): 790-805.
Deng L, Shen BQ, Wang LC, et al. Genome-wide bioinformatics analysis of AP2/EREBP transcription factor in 'Hongyang' kiwifruit. J Fruit Sci, 2017, 34(7): 790-805 (in Chinese).