小麦CesA基因家族鉴定及特征分析
-
关键词:
- 小麦 /
- 纤维素合成酶(CesA) /
- 生物信息学分析 /
- 基因表达谱
Identification and Characteristic Analysis of Wheat CesA Gene Family
-
Keywords:
- wheat /
- cellulose synthase (CesA) /
- bioinformatics analysis /
- gene expression profile
-
纤维素是构成植物细胞壁的主要成分,是地球上最丰富的生物聚合物材料和重要的碳汇来源[1]。纤维素通常以微小纤丝的形式存在,其基本单位是吡喃式-D-葡萄糖,通过β-1,4糖苷键连接成长链结构。研究表明:纤维素复合物的合成需要多个基因间的相互作用[2]。纤维素的生物合成也需要多个纤维素合成酶基因的共同参与,在同一个细胞的同一个发育期有多个植物纤维素合成酶基因同时表达[3]。植物纤维素的生物合成是由植物纤维素合成酶(cellulose synthase A,CesA)组成的纤维素合酶复合体(cellulose synthase complex,CSC)与其他酶共同完成的复杂过程[4-5]。CesA是执行纤维素合成功能的执行蛋白。在高等植物中,CesA呈六边莲花座型,在细胞膜上组装成CSC并实现合成纤维素的功能[6]。可见,CesA对细胞壁纤维素含量及优劣有较大影响。CesA基因最早在陆地棉(Gossypium hirsutum)和水稻(Oryza sativa)中被鉴定[7],并相继在其他物种中被报道,其中,模式植物拟南芥(Arabidopsis thaliana) 的CesA基因研究最为成熟[8]。拟南芥中已知的CesA基因有10个,其中AtCesA1、AtCesA3、AtCesA6和AtCesA10参与初生细胞壁的形成;AtCesA4、AtCesA7和AtCesA8只在次生细胞壁中表达,协同调控次生细胞壁的形成[9];AtCesA2、AtCesA5、AtCesA9和AtCesA6在功能上有部分冗余[10]。对水稻、大麦(Hordeum vulgare L.)和陆地棉等作物的研究也表明:CesA4基因参与次生壁形成,该基因突变或过表达可导致纤维素含量升高或降低[11]。
小麦(Triticum aestivum L.)是世界上重要的三大谷物之一,其麸皮富含纤维素和半纤维素,是制粉工业的主要副产品,也是制取膳食纤维的理想原料。目前,麦麸膳食纤维提取技术较为成熟,但是纤维素和半纤维素的酶解和蛋白质变性等都会影响膳食纤维的提取率[12]。纤维素虽然不被人体吸收,但能有效增加食物残渣的体积和质量,使之在肠道运行中加快,并及时刺激肠道排便[13]。因此,通过了解小麦纤维素的生物合成机理进而改善小麦纤维的质量与产量就十分必要。纤维素合成酶基因(CesA)大多在模式植物拟南芥、水稻和陆地棉中被研究,其他的非模式植物鲜有深入研究。随着小麦数据库的完善,有必要对小麦CesA基因家族进行分析。本研究采用生物信息学方法对小麦CesA基因家族进行多方面分析,以期为提高小麦的纤维素含量提供新方法,也为分析该基因在小麦生长发育和抗逆性等方面的功能奠定基础,并为植物细胞壁代谢和抗旱分子机制研究提供新思路。
1. 材料与方法
1.1 小麦CesA基因家族的检索与鉴定
为鉴定得到小麦CesA基因家族成员,收集来自玉米(Zea mays)[6]、拟南芥(Aabidopsis thaliana)和水稻(Oryza sativa)[14]的37条CesA蛋白序列作为BLASTp分析的查询序列;从HMMER 3.0下载pfam域PF14569 (zf-UDP)和PF03552 (Cellulose_synt)隐马尔可夫模型的种子序列作为查询序列。利用上述2个来源获得的序列作为查询序列,设截断值(e-value) <10−5以保证蛋白质序列的可靠性,通过BLASTp (https://blast.ncbi.nlm.nih.gov)查询小麦数据库 (IWGSC v1.1,https://wheat-urgi.versailles.inra.fr/Seq-Repository/Asse mblies)[15],合并结果并删除冗余序列。去冗余后的序列用pfam (v32.0,http://pfam.xfam.org/)进一步筛选,最终确定21个TaCesA基因家族成员。
1.2 序列比对、系统进化树构建和TaCesA染色体定位
分别收集拟南芥、水稻、玉米和小麦的CesA蛋白序列,利用ClustalW2软件比对氨基酸序列[16];利用MEGA 7.0软件构建系统发育关系[17];通过ITOL v3.2.317 (http://itol.embl.de)绘制并美化系统发育树。从小麦数据库IWGSC v1.1中获取小麦基因组注释文件,并从中提取小麦CesA基因的注释信息;基于TaCesA基因在相应染色体上的起点和终点位置信息,采用MapInspect软件绘制物理图谱[18]。
1.3 TaCesA蛋白质特征分析
使用蛋白质分析工具ExPASy Server 10 (https://prosite.expasy.org/PS50011)预测TaCesA的蛋白质特征,包括蛋白质长度、分子量、等电点以及稳定性和亲水性[19]。使用Plant-mPLoc (http://www.csbio.sjtu.edu.cn/cgi-bin/PlantmPLoc.cgi) 预测TaCesA蛋白的亚细胞定位[20]。
1.4 TaCesA基因结构、保守基序和顺式元件分析
使用MEME (http://meme-suite.org)[21]和Smart Motif (http://smart.embl-heidelberg.de/)[22]搜索工具鉴定保守的TaCesA蛋白基序,用已知的拟南芥、水稻和玉米CesA蛋白序列作为对照序列。在MEME中用判别模式将对照序列按照以下标准鉴定保守的TaCesA基因保守基序(motif):每个序列可以包含任意数量的motif非重叠出现,不同motif的数量为20,motif宽度范围为6~50 个氨基酸。根据TaCesA基因组注释信息,使用软件Tbtools和GSDS 2.0 (http://gsds.cbi.pku.edu.cn/index.php)[23]绘制并美化遗传结构图。从小麦数据库(IWGSC v1.1)提取TaCesA基因的上游序列(1~1500 bp),用PlantCARE (http://bioinformatics.psb.ugent.be/webtools/plantcare/html/) 鉴定其启动子中的顺式作用元件[24],并用R包中的“pheatmap”展示预测结果。
1.5 TaCesA蛋白质跨膜结构的预测和三维结构建模
通过在线TMHMM Server v2.0 (http://www.cbs.dtu.dk/services/TMHMM)[25]预测小麦CesA蛋白的跨膜结构。使用SWISS-MODEL server (https://www.swissmodel.expasy.org/)对TaCesA蛋白序列进行三维建模[26]。
1.6 同源基因的鉴定与分析
从Ensembl Plants数据库(http://plants.ensembl.org/index.html)下载小麦亚基因组供体乌拉尔图小麦(T. urartu)、野生二粒麦(T. dicoccoides)和粗山羊草(Aegilops tauschii)的参考基因组数据库,通过BLASTp分析鉴定其CesA基因,采用截断值<10−10、同一性>80%判断直系同源性的可靠性[27],通过R包“circlize”展示同源关系。
1.7 TaCesA的转录组分析
从NCBI (SRA)数据库下载小麦多个条件转录组原始RNA-seq数据,并通过hisat2将其定位到小麦参考基因组;通过Cufflinks检查小麦CesA基因的表达水平(通过TPM标准化)[28];使用R软件包“pheatmap”分析并绘制TaCesA基因的表达谱热图。
2. 结果与分析
2.1 小麦基因组CesA的鉴定、系统发育和染色体定位分析
共鉴定出21个小麦CesA基因(表1),系统发育树(图1)将拟南芥、水稻、玉米和小麦的CesA蛋白序列分为3组(a、b和c)。a组包含6个TaCesA基因、2个AtCesA基因和3个ZmCesA基因;b组包含6个TaCesA基因、1个AtCesA基因、3个ZmCesA基因和2个OsCesA基因;c组包含9个TaCesA基因、7个AtCesA基因、10个ZmCesA基因和7个OsCesA基因。
表 1 小麦CesA基因家族编码蛋白质的特征和理化性质Table 1. The characteristics and physicochemical properties of the protein encoded by CesA genes in wheat基因
gene基因 ID
gene ID长度/aa
length分子量/u
molecular weight等电点
isoelectric point不稳定指数
instability index亲水性平均值
average of hydropathicity染色体位置
chromosome position亚细胞定位预测
subcellular localization predictionTaCesA1-1A TraesCS1A02G116200.1 826 93 631.96 7.67 44.77 −0.503 Chr 1A 叶绿体
chloroplastTaCesA2-1A TraesCS1A02G149300.1 1 048 118 457.14 7.75 41.98 −0.305 Chr 1A 叶绿体
chloroplastTaCesA3-1B TraesCS1B02G136200.1 1 046 118 326.05 7.89 42.05 −0.305 Chr 1B 叶绿体
chloroplastTaCesA4-1B TraesCS1B02G167200.1 1 044 118 178.92 7.75 41.25 −0.303 Chr 1B 叶绿体
chloroplastTaCesA5-1D TraesCS1D02G117400.1 1 091 123 363.88 7.41 39.79 −0.236 Chr 1D 叶绿体
chloroplastTaCesA6-1D TraesCS1D02G146600.1 1 091 123 363.88 7.41 39.79 −0.236 Chr 1D 叶绿体
chloroplastTaCesA7-2A TraesCS2A02G102600.1 1 054 117 747.75 7.70 38.25 −0.234 Chr 2A 叶绿体、高尔基体
chloroplast, golgi apparatusTaCesA8-2B TraesCS2B02G119700.1 1 152 — — 38.75 −0.232 Chr 2B 叶绿体
chloroplastTaCesA9-2D TraesCS2D02G102100.1 1 144 129 307.65 7.28 41.71 −0.226 Chr 2D 高尔基体
golgi apparatusTaCesA10-4A TraesCS4A02G355000.1 1 078 121 606.74 6.58 38.01 −0.209 Chr 4A 叶绿体、细胞核
chloroplast, nucleusTaCesA11-5A TraesCS5A02G222500.1 1 053 118 389.94 6.31 39.87 −0.208 Chr 5A 叶绿体
chloroplastTaCesA12-5A TraesCS5A02G459400.2 1 079 121 633.76 6.58 38.18 −0.206 Chr 5A 叶绿体
chloroplastTaCesA13-5B TraesCS5B02G221600.3 1 080 120 879.48 7.46 38.63 −0.206 Chr 5B 叶绿体
chloroplastTaCesA14-5B TraesCS5B02G469200.1 1 054 118 575.19 6.29 40.22 −0.205 Chr 5B 叶绿体
chloroplastTaCesA15-5B TraesCS5B02G517500.1 1 075 121 260.37 6.46 38.74 −0.202 Chr 5B 叶绿体
chloroplastTaCesA16-5D TraesCS5D02G230300.1 1 075 121 274.39 6.46 38.92 −0.202 Chr 5D 叶绿体
chloroplastTaCesA17-5D TraesCS5D02G470400.1 1 075 121 274.39 6.46 38.92 −0.202 Chr 5D 叶绿体
chloroplastTaCesA18-5D TraesCS5D02G517200.1 1 090 122 101.90 7.01 38.90 −0.199 Chr 5D 叶绿体
chloroplastTaCesA19-6A TraesCS6A02G077800.1 1 054 118 401.00 6.38 38.58 −0.193 Chr 6A 叶绿体
chloroplastTaCesA20-6B TraesCS6B02G104600.1 1 044 116 569.58 8.13 38.67 −0.190 Chr 6B 叶绿体
chloroplastTaCesA21 TraesCSU02G142500.1 1 074 119 820.13 7.68 37.71 −0.181 Chr Un 叶绿体
chloroplast由表1可知:有20个TaCesA基因分布在小麦的12条染色体上,并均匀地分布在A (7个)、B (7个)和D (6个)亚基因组(图2);TaCesA21未被定位到染色体上;其他9条染色体 (3A、7A、3B、4B、7B、3D、4D、6D和7D)未预测到有小麦CesA基因分布。
2.2 TaCesA蛋白质特征分析
使用ExPASy Server 10预测小麦CesA蛋白质特征,结果(表1)表明:小麦CesA蛋白质氨基酸数量在826~1152之间,平均值为1 075.05;分子量在93 631.96~129 307.65 u之间,平均值为120 554.32 u;等电点(pI)范围为6.29~8.13,平均值为7.18,其中有部分小麦CesA蛋白质的等电点大于7,为碱性蛋白质。此外,TaCesA12-5A蛋白质序列包含多个连续的不确定氨基酸,无法计算其分子量和等电点。蛋白质不稳定指数在37.71~44.77之间,平均值为39.80,表明大部分小麦CesA蛋白质为稳定蛋白质,但TaCesA16-5D、TaCesA2-1A、TaCesA1-1A、TaCesA6-1D、TaCesA4-1B和TaCesA10-4A被预测为不稳定蛋白质。小麦CesA蛋白的氨基酸的亲水系数在−0.503~−0.181之间,表明这些蛋白都是亲水蛋白。亚细胞定位预测表明:有85%的TaCesA蛋白在叶绿体中表达,其余的TaCesA蛋白在高尔基体和细胞核中有表达。
2.3 TaCesA蛋白的基因结构和保守基序分析
构建小麦的TaCesA基因系统发育树(图3a)。基因结构分析结果(图3b)表明:每个TaCesA基因序列都具有多个(7~15个)内含子结构;19个TaCesA基因具有完整的UTR,但TaCesA10-4A的3′ 端没有UTR,TaCesA12-5A的5′ 端不含UTR,TaCesA18-5D和TaCesA15-5B的3 ′端含有2个UTR。综合来说,同组的小麦CesA基因具有相对保守的基因结构分布。
图 3 小麦CesA基因家族的基因结构分析和保守基序分析注:a) 小麦CesA基因的系统发育分析,a、b和c代表TaCesAs不同的分组;b) 基因结构分析,UTR. 非翻译区,CDS. 编码区;c) 小麦保守基序分析。Figure 3. Gene structure analysis and conserved motif analysis of wheat CesA gene familyNote: a) phylogenetic analysis of wheat CesA genes, a, b and c represent different groups of TaCesAs; b) gene structure analysis, UTR. untranslated region, CDS. coding region; c) conserved motif.对TaCesA蛋白中的20个保守基序(motif)进行分析,结果(图3c)表明:每个小麦CesA蛋白序列中都包含多个(13~20个) motif。其中,TaCesA10-4A的motif最少,TaCesA5-1D、TaCesA18-5D和TaCesA19-6A的motif最多。同时,有13个motif在TaCesA蛋白序列保守分布,分别是motif1、motif2、motif3、motif4、motif5、motif6、motif7、motif12、motif13、motif14、motif15、motif18和motif19,说明小麦CesA蛋白在序列分布上整体较为相似。
2.4 TaCesA基因家族中顺式作用元件分析鉴定
对21个小麦CesA基因上游1.5 kb区域进行分析,共鉴定到44种顺式作用元件,可分为生物胁迫/非生物胁迫(24个)、生长发育(7个)和植物激素(13个)等三大类(图4a)。其中,分布最多的顺式作用元件是转录启动子的核心启动子元件(TATA-box)以及启动子和增强子区域常见的顺式作用元件(CAAT-box),其次是涉及脱落酸反应的顺式作用元件(ABRE)和参与光响应的顺式作用元件(G-box)。生物胁迫类别中有多个光响应元件,如3-AF1 binding、GT1-motif、chs-CMA2a和Sp1等;生长发育类别中还发现了参与种子特异性调控的顺式调控元件(RY-element)以及与分生组织表达有关的顺式调控元件(CAT-box);激素类别中有生长素反应性涉及的顺式调控元件(AuxRR-core)和赤霉素反应元件(GARE-motif和P-box)。此外, 还有一部分与植物逆境有关的元件,如参与低温响应的顺式作用元件(LTR)、参与防御和应激反应的顺式作用元件(TC-rich repeats)以及参与缺氧特异性诱导的类增强子(GC-motif)。由图4b可知:TaCesA3-1B是顺式元件总含量最高的基因,TaCesA8-2B总含量位居第2。
2.5 TaCesA蛋白跨膜结构预测和建模分析
TaCesA蛋白质跨膜预测结果表明:仅TaCesA10-4A含有2个跨膜螺旋,其余20个小麦CesA的蛋白跨膜螺旋数量均为6个或8个(图5a)。小麦CesA的氨基酸序列建模结果表明:21个小麦CesA蛋白的三级结构相似性较高,均含有α-螺旋,图5b为从小麦21个CesA蛋白序列中挑选4条最具代表性的序列(TaCesA1-1A、TaCesA3-1B、TaCesA4-1B和TaCesA10-4A)进行三级结构展示。
2.6 小麦及其亚基因组供体中CesA基因的进化分析和同源基因对分析
在小麦、乌拉尔图小麦、野生二粒麦和粗山羊草中共鉴定得到38个CesA同源基因,系统发育树(图6a)表明:这38个CesA蛋白同样归为3组(a、b和c),a和b组均包含6个TaCesA基因,c组包含9个TaCesA基因。
分别比较小麦与乌拉尔图小麦、野生二粒麦、粗山羊草3组直系同源基因对的数量,结果(图6b)表明:小麦与乌拉尔图小麦有20对直系同源基因对,与野生二粒麦有27对直系同源基因对,与粗山羊草有12对直系同源基因对。综合小麦及其亚基因组供体的系统发育树、同源性分析结果和直系同源基因对的数量,推测小麦CesA基因与其亚基因组供体之间关系非常保守。
2.7 TaCesA基因表达谱分析
在非生物胁迫下,TaCesA7-2A、TaCesA21和TaCesA12-5A在缺磷、高温、低温和干旱处理下都有不同程度的表达(图7a);在生长发育中,有6个TaCesA基因(TaCesA19-6A、TaCesA14-5B、TaCesA12-5A、TaCesA20-6B、TaCesA7-2A和TaCesA21)高表达,其他11个基因有不同程度的表达,但有4个TaCesA基因没有表达(图7b);在生物胁迫中,条锈菌、白粉菌和禾谷镰刀菌胁迫下有17个TaCesA基因有不同程度的表达,部分基因在全部处理下都有较高的表达水平,如TaCesA14-5B、TaCesA20-6B和TaCesA19-6A (图7c)。此外, TaCesA8-2B、TaCesA9-2D、TaCesA10-4A和TaCesA17-5D在生物胁迫、非生物胁迫和生长发育中的表达水平均很低或完全没有表达。
3. 讨论
不同植物的CesA基因家族成员数量存在一定差距。小麦和玉米中分别有21个和16个CesA基因[6],在拟南芥和水稻中分别有10个和11个CesA基因[14],其原因可能是小麦为三倍体物种,其CesA基因数量高于其他物种。通过对4个物种的系统发育树分析,将58条CesA蛋白序列分为a、b和c组,分析发现这4个物种在c组中的数量均高于a和b组,且a组中不包含OsCesA基因。小麦的21个CesA基因中,TaCesA21未被定位到具体位置,其余20个基因分布在小麦的12条染色体上,并均匀的分布在A、B和D亚基因组;其他9条染色体未定位到TaCesA基因,这可能是因为多倍体小麦在进化过程中某些染色体上的TaCesAs基因发生了丢失[29]。小麦及其亚基因组供体中CesA基因的同源基因对分析结果可知:小麦与野生二粒麦有27对直系同源基因对,表明小麦中的CesA基因更多来自于野生二粒麦,两者的亲缘关系更近。TaCesA蛋白质跨膜表明其有多个跨膜螺旋,但未在细胞膜上预测到TaCesA蛋白,说明它可能作为膜受体起作用。纤维素合酶在内质网中合成,在内质网或高尔基体中组装成完整的纤维素合酶复合体,通过囊泡运输转运到质膜,质膜上的纤维素合酶复合体可通过网格蛋白介导的内吞作用回收到胞内[30],这与TaCesA蛋白质被预测到在高尔基体中表达并存在跨膜螺旋作为膜受体起作用一致。
在植物细胞壁合成过程中,CesA基因在转录水平上对纤维素的合成进行调控从而发挥重要作用[14]。从基因结构上看,CesA基因最大的差异在于某些区域中是否有内含子,其位置是确定纤维素合成酶功能的关键因素之一[8]。小麦CesA基因均含有7~15个内含子,可能因为其数量不同使TaCesA基因在功能上存在差异。另外,mRNA的5′ UTR与3′ UTR在翻译过程中互相依赖、协同提高翻译效率[31]。小麦CesAs中,有19个TaCesA基因含有完整的UTR结构,说明大部分小麦CesA基因能发挥生物功能,而缺失5′ 或3′ UTR结构的TaCesA基因可能存在功能差异。对21个TaCesA基因上游1.5 kb区域的顺式作用元件分析可知:涉及脱落酸反应的顺式作用元件(ABRE)是除TATA-box和CAAT-box元件外含量最高的元件。植物激素脱落酸 (ABA) 在应对重金属、干旱、热、高盐、低温和辐射等胁迫的耐受过程中起重要作用[32],因此,在小麦生长发育过程中,CesA基因能在抵御非生物胁迫中发挥重要作用。这与玉米CesA基因在抗干旱胁迫中的研究结果是一致的[6]。表达谱分析结果表明:缺磷、高温、低温和干旱胁迫下TaCesA基因有不同的应答机制。在生物胁迫、非生物胁迫和生长发育中,TaCesA8-2B、TaCesA9-2D、TaCesA10-4A和TaCesA17-5D表达水平很低或完全没有表达,是否存在功能冗余还需要进一步验证。本研究还发现:多个TaCesA基因在条锈菌、白粉菌和禾谷镰刀菌胁迫下均有不同程度的表达,甚至有一部分基因在这几个处理下都有很高的表达水平,提示CesA基因可能参与小麦生物胁迫响应,但是其具体功能还需要进一步研究。
4. 结论
本研究在小麦基因组鉴定到21个TaCesA基因,分为3组,它们在基因结构上具有相似的蛋白motif组成,其上游序列中分别有24个、7个和13个与生物胁迫/非生物胁迫、生长发育和植物激素响应相关的顺式作用元件,其中涉及脱落酸反应的顺式作用元件(ABRE)含量较高,与TaCesA基因参与小麦抵御非生物胁迫有关系;有17个TaCesA基因对小麦应对非生物和生物胁迫有明显响应。研究结果可为进一步挖掘纤维素合成酶基因在小麦中的功能奠定基础。
-
图 3 小麦CesA基因家族的基因结构分析和保守基序分析
注:a) 小麦CesA基因的系统发育分析,a、b和c代表TaCesAs不同的分组;b) 基因结构分析,UTR. 非翻译区,CDS. 编码区;c) 小麦保守基序分析。
Figure 3. Gene structure analysis and conserved motif analysis of wheat CesA gene family
Note: a) phylogenetic analysis of wheat CesA genes, a, b and c represent different groups of TaCesAs; b) gene structure analysis, UTR. untranslated region, CDS. coding region; c) conserved motif.
表 1 小麦CesA基因家族编码蛋白质的特征和理化性质
Table 1 The characteristics and physicochemical properties of the protein encoded by CesA genes in wheat
基因
gene基因 ID
gene ID长度/aa
length分子量/u
molecular weight等电点
isoelectric point不稳定指数
instability index亲水性平均值
average of hydropathicity染色体位置
chromosome position亚细胞定位预测
subcellular localization predictionTaCesA1-1A TraesCS1A02G116200.1 826 93 631.96 7.67 44.77 −0.503 Chr 1A 叶绿体
chloroplastTaCesA2-1A TraesCS1A02G149300.1 1 048 118 457.14 7.75 41.98 −0.305 Chr 1A 叶绿体
chloroplastTaCesA3-1B TraesCS1B02G136200.1 1 046 118 326.05 7.89 42.05 −0.305 Chr 1B 叶绿体
chloroplastTaCesA4-1B TraesCS1B02G167200.1 1 044 118 178.92 7.75 41.25 −0.303 Chr 1B 叶绿体
chloroplastTaCesA5-1D TraesCS1D02G117400.1 1 091 123 363.88 7.41 39.79 −0.236 Chr 1D 叶绿体
chloroplastTaCesA6-1D TraesCS1D02G146600.1 1 091 123 363.88 7.41 39.79 −0.236 Chr 1D 叶绿体
chloroplastTaCesA7-2A TraesCS2A02G102600.1 1 054 117 747.75 7.70 38.25 −0.234 Chr 2A 叶绿体、高尔基体
chloroplast, golgi apparatusTaCesA8-2B TraesCS2B02G119700.1 1 152 — — 38.75 −0.232 Chr 2B 叶绿体
chloroplastTaCesA9-2D TraesCS2D02G102100.1 1 144 129 307.65 7.28 41.71 −0.226 Chr 2D 高尔基体
golgi apparatusTaCesA10-4A TraesCS4A02G355000.1 1 078 121 606.74 6.58 38.01 −0.209 Chr 4A 叶绿体、细胞核
chloroplast, nucleusTaCesA11-5A TraesCS5A02G222500.1 1 053 118 389.94 6.31 39.87 −0.208 Chr 5A 叶绿体
chloroplastTaCesA12-5A TraesCS5A02G459400.2 1 079 121 633.76 6.58 38.18 −0.206 Chr 5A 叶绿体
chloroplastTaCesA13-5B TraesCS5B02G221600.3 1 080 120 879.48 7.46 38.63 −0.206 Chr 5B 叶绿体
chloroplastTaCesA14-5B TraesCS5B02G469200.1 1 054 118 575.19 6.29 40.22 −0.205 Chr 5B 叶绿体
chloroplastTaCesA15-5B TraesCS5B02G517500.1 1 075 121 260.37 6.46 38.74 −0.202 Chr 5B 叶绿体
chloroplastTaCesA16-5D TraesCS5D02G230300.1 1 075 121 274.39 6.46 38.92 −0.202 Chr 5D 叶绿体
chloroplastTaCesA17-5D TraesCS5D02G470400.1 1 075 121 274.39 6.46 38.92 −0.202 Chr 5D 叶绿体
chloroplastTaCesA18-5D TraesCS5D02G517200.1 1 090 122 101.90 7.01 38.90 −0.199 Chr 5D 叶绿体
chloroplastTaCesA19-6A TraesCS6A02G077800.1 1 054 118 401.00 6.38 38.58 −0.193 Chr 6A 叶绿体
chloroplastTaCesA20-6B TraesCS6B02G104600.1 1 044 116 569.58 8.13 38.67 −0.190 Chr 6B 叶绿体
chloroplastTaCesA21 TraesCSU02G142500.1 1 074 119 820.13 7.68 37.71 −0.181 Chr Un 叶绿体
chloroplast -
[1] DANIEL J, COSGROVE. Growth of the plant cell wall[J]. Nature Reviews. Molecular Cell Biology, 2005, 6(11): 850. DOI: 10.1038/nrm1746.
[2] CARROLL A, SPECHT C D. Understanding plant cellulose synthases through a comprehensive investigation of the cellulose synthase family sequences[J]. Frontiers in Plant Science, 2011, 2(5): 5. DOI: 10.3389/fpls.2011.00005.
[3] 李春秀, 齐力旺, 王建华, 等. 植物纤维素合成酶基因和纤维素的生物合成[J]. 生物技术通报, 2005(4): 5. DOI: 10.3969/j.issn.1002-5464.2005.04.002. [4] DELMER D P. CELLULOSE BIOSYNTHESIS: exciting times for a dificult field of study[J]. Annual Review of Plant Physiology and Plant Molecular Biology, 1999, 50: 245. DOI: 10.1146/annurev.arplant.50.1.245.
[5] TONY A, PENG L C, ANDREAS S, et a1. Molecular analysis of cellulose biosynthesis in Arabidopsis[J]. Science, 1998, 279: 717. DOI: 10.1126/science.279.5351.717.
[6] 张晓榕, 谭俊峰, 温曼晴, 等. 玉米CesA家族的系统鉴定及功能研究[J]. 西北农林科技大学学报(自然科学版), 2019, 47(2): 45. DOI: 10.13207/j.cnki.jnwafu.2019.02.006. [7] JULIE R P, YASUSHI K, WILLIAM E, et al. Higher plants contain homologs of the bacterial celA genes encoding the catalytic subunit of cellulose synthase[J]. Proceedings of the National Academy of Sciences of the United States of America, 1996, 93(22): 12637. DOI: 10.1073/pnas.93.22.12637.
[8] TODD R. Higher plant cellulose synthases[J]. Genome Biology, 2000, 1(4): 1. DOI: 10.1186/gb-2000-1-4-reviews3001.
[9] TAYLOR N G, HOWELLS R M, HUTTLY A K, et al. Interactions among three distinct CesA proteins essential for cellulose synthesis[J]. Proceedings of the National Academy of Sciences of the United States of America, 2003, 100(3): 1450. DOI: 10.1073/pnas.0337628100.
[10] THIERRY D, MICHAL J, ELIZABETH F C, et al. Organization of cellulose synthase complexes involved in primary cell wall synthesis in Arabidopsis thaliana[J]. Proceedings of the National Academy of Sciences of the United States of America, 2007, 104(39): 15572. DOI: 10.1073/pnas.0706569104.
[11] YAN C J, YAN S, ZENG X H, et al. Fine mapping and isolation of Bc7(t), allelic to OsCesA4[J]. Journal of Genetics and Genomics, 2007, 34(11): 1019. DOI: 10.1016/S1673-8527(07)60115-5.
[12] 付浩华, 张冬秀. 麦麸膳食纤维的提取[J]. 农产品加工, 2019(7): 45. DOI: 10.16693/j.cnki.1671-9646(X).2019.07.012. [13] 张玉兰. 论纤维素对人体的功能[J]. 安徽农业科学, 2007, 35(11): 3351. DOI: 10.3969/j.issn.0517-6611.2007.11.111. [14] 王振怡, 王金朋, 潘玉欣, 等. 拟南芥和水稻CesA基因家族的生物信息学分析[J]. 河南农业科学, 2015, 44(6): 13. [15] MICHAEL A, JANE R, THOMAS L, et al. Linking the international wheat genome sequencing consortium bread wheat reference genome sequence to wheat genetic and phenomic data[J]. Genome Biology, 2018, 19(1): 111. DOI: 10.1186/s13059-018-1491-4.
[16] THOMPSON J D, HIGGINS D G, GIBSON T J, et al. CLUSTALW: improving the sensitivity of progressive multiple sequence alignment through sequence weighting, position-specific gap penalties and weight matrix choice[J]. Nucleic Acids Research, 1994, 22(22): 4673. DOI: 10.1093/nar/22.22.4673.
[17] KUMAR S, STECHER G, TAMURA K, et al. MEGA7: molecular evolutionary genetics analysis version 7.0 for bigger datasets[J]. Molecular Biology and Evolution, 2016, 33(7): 1870. DOI: 10.1093/molbev/msw054.
[18] HU L F, LIU S Q. Genome-wide identification and phylogenetic analysis of the ERF gene family in cucumbers[J]. Genetics and Molecular Biology, 2011, 34(4): 624. DOI: 10.1590/s1415-47572011005000054.
[19] LI R, AN J P, YOU C X, et al. Identification and expression of the CEP gene family in apple (Malus×domestica)[J]. Journal of Integrative Agriculture, 2018, 17(2): 348. DOI: 10.1016/S2095-3119(17)61653-8.
[20] CHOU K C, SHEN H B. Plant-mPLoc: a top-down strategy to augment the power for predicting plant protein subcellular localization[J]. PLoS One, 2010, 5(6): e11335. DOI: 10.1371/journal.pone.0011335.
[21] BAILEY T L, BODEN M, BUSKE F A, et al. MEME Suite: tools for motif discovery and searching[J]. Nuclc Acids Research, 2009, 37: W202. DOI: 10.1093/nar/gkp335.
[22] LETUNIC I, BORK P. 20 years of the SMART protein domain annotation resource[J]. Nucleic Acids Research, 2018, 46(D1): 493. DOI: 10.1093/nar/gkx922.
[23] HU L P, ZHANG F, SONG S H, et al. Genome-wide identification, characterization, and expression analysis of the SWEET gene family in cucumber[J]. Journal of Integrative Agriculture, 2017, 16(7): 1486. DOI: 10.1016/S2095-3119(16)61501-0.
[24] ZHU Y X, YANG L, LIU N, et al. Genome-wide identification, structure characterization, and expression pattern profiling of aquaporin gene family in cucumber[J]. BMC Plant Biology, 2019, 19(1): 345. DOI: 10.1186/s12870-019-1953-1.
[25] KROGH A, LARSSON B, HEIJNE V G, et a1. Predicting transmembrane protein topology with a hidden markov model: application to complete genomes[J]. Journal of Molecular Biology, 2001, 305(3): 567. DOI: 10.1006/jmbi.2000.4315.
[26] SIMON C L, IAN W D, ARENDALL W B, et al. Structure validation by Cα geometry: ψ and Cβ deviation[J]. Proteins, 2003, 50(3): 437. DOI: 10.1002/prot.10286.
[27] HE Y Q, HUANG W D, YANG L, et al. Genome-wide analysis of ethylene-insensitive3 (EIN3/EIL) in Triticum aestivum[J]. Crop Science, 2020, 60: 2019. DOI: 10.1002/csc2.20115.
[28] COLE T, ADAM R, LOYAL G, et al. Differential gene and transcript expression analysis of RNA-seq experiments with TopHat and Cufflinks[J]. Nature Protocols, 2012, 7(3): 562. DOI: 10.1038/nprot.2012.016.
[29] JIANG W Q, GENG Y P, LIU Y K, et al. Genome-wide identification and characterization of SRO gene family in wheat: molecular evolution and expression profiles during different stresses[J]. Plant Physiology and Biochemistry, 2020, 154: 590. DOI: 10.1016/j.plaphy.2020.07.006.
[30] 刘振东, 赵淑举, 蒋苏, 等. 植物纤维素合酶复合体组装与运输研究进展[J]. 植物生理学报, 2020, 56(9): 1757. DOI: 10.13592/j.cnki.ppj.2020.0019. [31] 江元清, 凌毅, 赵武玲. 真核mRNA的3′非翻译区转录后水平调控作用研究进展[J]. 植物学通报, 2001, 18(1): 3. DOI: 10.3969/j.issn.1674-3466.2001.01.003. [32] 刘娟娟, 汪惠丽. 植物中脱落酸对非生物胁迫的耐受性研究进展[J]. 安徽农业科学, 2017, 45(16): 11. DOI: 10.3969/j.issn.0517-6611.2017.16.004. -
期刊类型引用(4)
1. 孔斌雪,李娜,马靖福,窦佳欣,陈涛,张沛沛,刘媛,杨德龙. 小麦SUS基因家族鉴定与生物信息学分析. 云南农业大学学报(自然科学). 2024(01): 1-8 . 百度学术
2. 胡玲玲,徐涛,杨杰,龚丽丽,杨语心,杨中义,吴月燕. 葡萄纤维素合酶超家族基因鉴定及其表达分析. 农业生物技术学报. 2024(05): 1020-1036 . 百度学术
3. 周云新,曹磊,王际宇,王盼乔,李琼,杨路明,胡建斌,侯娟. 甜瓜HD-Zip家族基因的鉴定及在表皮毛发育中的表达分析. 河南农业大学学报. 2023(02): 241-257 . 百度学术
4. 王宙,王宏伟,王亚,杨俊芳,赵宜婷,张宏斌,曹越. 蓖麻CeSA转录因子基因家族的鉴定与表达分析. 激光生物学报. 2023(02): 160-169 . 百度学术
其他类型引用(1)