牛科物种FEZF2基因分子特征、功能预测及进化分析
-
关键词:
- 牛科物种 /
- FEZF2基因 /
- 分子特征 /
- 基因功能 /
- 生物信息学与比较基因组学分析
Molecular Characterization, Functional Prediction and Evolutionary Analysis of FEZF2 Gene in Species of Bovidae
-
FEZ家族锌指蛋白2 (FEZ family zinc finger protein 2,FEZF2)又称前脑胚胎锌指样蛋白2 (forebrain embryonic zinc finger-like protein 2),是锌指蛋白超基因家族的重要成员,包含6个C2H2锌指结构和1个甘氨酸重复区域[1-5]。FEZF2作为一种转录激活/抑制因子,参与神经元发育的转录调控[1-4]。研究发现:动物神经元发育通过下游细胞因子的表达与机体免疫关联[2,5-7]。奶牛乳腺炎的易感性与信号素5A (semaphorin 5A,SEMA5A)的转录活性下降而导致的免疫反应受损有关[2]。乳腺炎可诱导FEZF2基因在乳腺中表达,导致SEMA5A的表达上调,进而诱导与机体免疫相关的TNF-α和IL-8等多个基因表达[2]。在乳腺炎中,FEZF2均能诱导SEMA5A表达上调,但在易感奶牛中其表达水平低于乳腺炎抗性牛[2]。在奶牛中发现:FEZF2基因编码产物的多个甘氨酸残基重复区存在12G重复和13G重复2种等位基因,13G型的FEZF2等位基因降低了SEMA5A的表达水平,导致13G/13G基因型奶牛对乳腺炎易感,发病率是12G/12G 基因型奶牛的2倍[8]。FEZF2基因位于普通牛第22号染色体,包含6个外显子和5个内含子,编码序列 (coding sequence,CDS)全长为1380 bp (登录号:NM_001038198.2);水牛FEZF2基因定位于第21号染色体,包含9个外显子和8个内含子,CDS全长也为1380 bp (登录号:XM_045163982.1)。魏伟等[5]对河流型和沼泽型水牛群体FEZF2基因的检测发现:河流型水牛中存在c.165G>A,属于同义替换,且河流型与沼泽型水牛的FEZF2基因多个甘氨酸残基重复编码区都为13G型。张广乐等[6]研究发现:FEZF2基因在12个水牛组织中都有表达,其中在大脑的表达量最高,该基因可能在水牛中作为一类核内转录因子广泛参与基因的表达调控过程。FEZF2分别位于山羊的第22号、绵羊的第19号染色体上,它们都含有5个外显子和4个内含子,编码区长度与普通牛和水牛基本一致。
牛科家养动物包括普通牛、水牛、牦牛、绵羊和山羊等,具有奶用、肉用和役用等多种用途,在全球畜牧业生产中发挥着重要作用。FEZF2作为一种转录因子,参与神经元的发育,可能与动物的先天免疫和奶牛的乳腺炎紧密相关[1-4],但目前有关牛科物种FEZF2基因的研究还十分有限。基于此,本研究从NCBI和Ensembl数据库下载牛科家畜FEZF2基因及其编码蛋白序列,并以下载的非牛科动物的同源序列为对照,采用生物信息学和比较基因组学方法,对牛科主要家畜FEZF2基因的结构、编码蛋白的氨基酸组成、理化特征、结构、进化关系、参与的生物学路径及分子功能等进行深入的比较分析,旨在解析牛科物种FEZF2基因的分子特征、基本功能及进化关系,为深入研究FEZF2基因调控动物免疫的机制和牛科家养动物的抗病育种提供参考。
1. 材料与方法
1.1 FEZF2序列及其注释文件的获取
用于数据分析的水牛、普通牛、瘤牛、杂交牛、牦牛、山羊和绵羊等牛科物种的FEZF2基因及其编码蛋白序列以及用于比较分析的一些非牛科动物的同源序列,均从NCBI数据库(https://www.ncbi.nlm.nih.gov/)和Ensembl数据库(http://asia.ensembl.org/index.html)下载。经初步比较分析,过滤不完整的序列或可能存在错误的序列后,用于本研究的序列数据信息见表1。用于数据分析的各物种基因组注释GTF文件由NCBI基因组数据库(https://www.ncbi.nlm.nih.gov/genome/?term=)下载得到。
表 1 FEZF2基因序列的来源Table 1. Sequence source of FEZF2 gene基因序列号
accession number of gene sequences蛋白质序列号
accession number of protein sequences物种
species序列来源
source of sequenceXM_045163982.1 XP_045019917.1 水牛 Bubalus bubalis NCBI NM_001038198.2 NP_001033287.1 普通牛 Bos taurus NCBI ENSBTAG00000020302 ENSBTAP00000027056 普通牛 Bos taurus Ensembl XM_019984262.1 XP_019839821.1 瘤牛 Bos indicus NCBI JX312831.1 AFS31067.1 瘤牛 Bos indicus NCBI ENSBIXG00000029646 ENSBIXP00000000579 杂交牛 Bos taurus hybrid Ensembl ENSBIXG00005030934 ENSBIXP00005045927 杂交牛 Bos indicus hybrid Ensembl ENSBGRG00000026510 ENSBGRP00000042330 牦牛 Bos grunniens Ensembl XM_005696081.3 XP_005696138.2 山羊 Capra hircus NCBI XM_004018621.5 XP_004018670.3 绵羊 Ovis aries NCBI XM_010980957.2 XP_010979259.2 单峰驼 Camelus dromedarius NCBI XM_032458017.1 XP_032313908.1 野骆驼 Camelus ferus NCBI XM_014868769.2 XP_014724255.1 驴 Equus asinus NCBI XM_023620158.1 XP_023475926.1 马 Equus caballus NCBI ENSCHYG00000014589 ENSCHYP00000021735 中亚马鹿 Cervus hanglu yarkandensis Ensembl XM_021069124.1 XP_020924783.1 猪 Sus scrofa NCBI NM_018008.4 NP_060478.3 人 Homo sapiens NCBI NM_080433.3 NP_536681.2 家鼠 Mus musculus NCBI XM_023249900.2 XP_023105668.1 猫 Felis catus NCBI XM_042927529.1 XP_042783463.1 狮子 Panthera leo NCBI XM_414411.6 XP_414411.2 鸡 Gallus gallus NCBI 1.2 基因结构、一致性及差异分析
从NCBI数据库下载各物种FEZF2基因的核苷酸序列,然后用ORF Finder程序(https://www.ncbi.nlm.nih.gov/orffinder/)通过开放阅读框(open reading frame,ORF)查找确定每条序列的CDS,进一步利用Lasergene软件包(DNAStar Inc.,USA)中的MegAlign程序分析各物种序列的一致性;FEZF2基因的碱基组成和核苷酸序列差异采用MEGA 7[9]进行计算或输出。从NCBI数据库下载牛科家畜及常见非牛科动物的基因组注释GTF文件,使用TBtools软件[10]对每个物种的FEZF2基因转录本进行信息完整化处理,进一步使用在线软件Gene Structure Display Server (http://gsds.gao-ab.org/)对每个物种的基因转录区域结构进行可视化。
1.3 分子特征、进化关系及生物学过程和分子功能
从NCBI数据库下载FEZF2基因的氨基酸序列,利用MegAlign程序分析各物种的序列一致性;采用MEGA 7[9]分析氨基酸序列差异并构建FEZF2蛋白氨基酸序列的系统发育树;将FEZF2蛋白氨基酸序列提交至MEME Suite网站(https://meme-suite.org/meme/)获得其基序结构信息;将各物种蛋白序列提交至NCBI的Conserved Domains数据库(https://www.ncbi.nlm.nih.gov/Structure/bwrpsb/bwrpsb.cgi)获得保守结构域。采用TBtools程序整合基序和保守结构域的分析结果。序列一致性、基序和保守结构域分析所使用的序列与基因结构分析使用的序列相对应。
FEZF2蛋白的理化特征与疏水性、信号肽和跨膜结构域采用在线软件ProtParam (https://web.expasy.org/protparam/)、ProtScale (https://web.expasy.org/protscale/)、SignalP 5.0 server (http://www.cbs.dtu.dk/services/SignalP/)和TMHMM 2.0 server (http://www.cbs.dtu.dk/services/TMHMM/)分别进行预测;蛋白质亚细胞定位及其二级和三级结构分别采用在线软件ProtComp (http://linux1.softberry.com/berry.phtml)、SOPMA (http://npsa-pbil.ibcp.fr/)和SWISS-MODEL (http://swissmodel.expasy.org/)进行分析。与FEZF2蛋白相互作用的蛋白、FEZF2参与的生物学过程和分子功能分别使用在线工具STRING (https://string-db.org/)和InterPro (http://www.ebi.ac.uk/interpro/search/sequence-search)进行分析。
2. 结果与分析
2.1 牛科物种FEZF2基因序列分析
2.1.1 编码区碱基组成、序列一致性与差异
由表2可知:牛科物种间FEZF2基因编码区的碱基组成相似,与非牛科物种的编码区碱基组成差异较大。在牛科物种中,表现为牛属和羊属动物的属内一致性更高,水牛与牛属和羊属动物有一定差异。由表3和图1可知:在FEZF2基因编码区序列一致性上,牛科物种间序列一致性在97.8%~100.0%之间,序列差异性较小;牛科与非牛科哺乳动物序列一致性在88.5%~98.2%之间,序列间差异相对较大;牛科物种与鸡的序列一致性仅在71.8%~72.1%之间,序列差异性最大。值得注意的是,牛科物种FEZF2基因CDS第313~351位核苷酸之间存在1个编码连续甘氨酸的序列区,该区域存在长度多态性,有12G (编码12个连续的甘氨酸)和13G (编码13个连续的甘氨酸) 2种类型,两者在长度上相差1个密码子。除鸡外,非牛科物种在第303位核苷酸之后也存在这个连续编码甘氨酸的序列区,但该区域在非牛科物种间长度差异较大,与牛科物种也不一致。核苷酸位点c.247A、c.480T和c.537T是牛属动物与水牛和羊属动物相互区分的核苷酸位点;c.771T是水牛与牛属动物和羊属动物相互区分的核苷酸位点。
图 1 牛科物种FEZF2基因核苷酸序列差异注:物种中文名见表1;“数字+G”表示该物种FEZF2蛋白序列中的甘氨酸重复数;下同。阴影部分为连续的甘氨酸编码区。Figure 1. Nucleotide sequence differences of FEZF2 gene in species of BovidaeNote: Chinese name of species list in Tab.1; “number+G” indicates the number of glycine repeats in the FEZF2 protein sequence of species; the same as below. The shaded area is the continuous glycine coding region.表 2 FEZF2基因编码区碱基组成Table 2. Base composition in the coding region of FEZF2 gene物种 species A G T C A+T C+G Bubalus bubalis_13G 21.30 28.26 16.45 33.99 37.75 62.25 Bos taurus_12G 21.42 28.03 16.63 33.91 38.05 61.95 Bos taurus_13G 21.38 28.12 16.59 33.91 37.97 62.30 Bos indicus_12G 21.57 27.96 16.49 33.99 38.05 61.95 Bos indicus_13G 21.38 28.12 16.52 33.99 37.90 62.10 Bos taurus hybrid_13G 21.38 28.12 16.59 33.91 37.97 62.03 Bos indicus hybrid_13G 21.38 28.12 16.52 33.99 37.90 62.10 Bos grunniens_13G 21.38 28.12 16.52 33.99 37.90 62.10 Capra hircus_13G 21.59 28.19 16.30 33.91 37.90 62.10 Ovis aries_13G 21.59 28.19 16.30 33.91 37.90 62.10 Camelus dromedarius_22G 21.10 28.61 16.02 34.26 37.12 62.88 Camelus ferus_24G 20.94 28.92 15.88 34.26 36.82 63.18 Equus asinus_16G 20.72 28.84 15.29 35.14 36.01 63.99 Equus caballus_19G 20.45 29.23 15.19 35.13 35.64 64.36 Cervus hanglu yarkandensis_14G 21.26 28.63 16.05 34.06 37.31 62.69 Sus scrofa_17G 21.35 28.32 16.49 33.84 37.84 62.16 Homo sapiens_16G 21.16 28.41 15.72 34.71 36.88 63.12 Mus musculus_7G 23.10 25.37 18.06 33.48 41.15 58.85 Felis catus_21G 20.57 29.46 15.41 34.55 35.99 64.01 Panthera leo_19G 20.81 29.16 15.48 34.56 36.29 63.71 Gallus gallus_0G 20.36 30.24 13.65 35.75 34.01 65.99 注:物种中文名见表1;“数字+G”表示该物种FEZF2蛋白序列中的甘氨酸重复数;下同。
Note: Chinese name of species list in Tab.1; “number+G” indicates the number of glycine repeats in the FEZF2 amino acid sequence of species; the same as below.表 3 牛科物种FEZF2基因核苷酸序列的一致性Table 3. Nucleotide sequence consistency of FEZF2 gene between the species of Bovidae and non-Bovidae% 物种
speciesBubalus
bubalis_
13GBos
taurus_
12GBos
taurus_
13GBos
indicus_
12GBos
indicus_
13GBos
taurus hybrid_
13GBos
indicus hybrid_
13GBos
grunniens_
13GCapra
hircus_
13GOvis
aries_
13GBubalus bubalis_13G *** 99.0 99.7 99.7 99.7 99.0 99.7 99.7 98.7 98.7 Bos taurus_12G 0.8 *** 99.3 99.3 99.4 99.8 99.3 99.3 97.9 97.9 Bos taurus_13G 0.3 0.5 *** 100.0 99.9 99.2 100.0 100.0 98.6 98.6 Bos indicus_12G 0.3 0.5 0.0 *** 99.9 99.2 100.0 100.0 98.6 98.6 Bos indicus_13G 0.4 0.4 0.1 0.1 *** 99.2 99.9 99.9 98.5 98.5 Bos taurus hybrid_13G 0.9 0.2 0.6 0.6 0.7 *** 99.2 99.2 97.8 97.8 Bos indicus hybrid_13G 0.3 0.5 0.0 0.0 0.1 0.6 *** 100.0 98.6 98.6 Bos grunniens_13G 0.3 0.5 0.0 0.0 0.1 0.6 0.0 *** 98.6 98.6 Capra hircus_13G 1.4 2.0 1.5 1.5 1.5 2.1 1.5 1.5 *** 99.9 Ovis aries_13G 1.4 2.0 1.5 1.5 1.5 2.1 1.5 1.5 0.1 *** 注:对角线以上数值表示序列一致性,对角线以下数值代表序列分歧度。
Note: The values above diagonal line indicate the identity, the values below the diagonal indicate divergence.2.1.2 基因转录区的结构
由图2可知:牛科物种FEZF2基因的CDS长度由于在多个连续甘氨酸残基编码区存在长度多态性而略有不同。普通牛和瘤牛的FEZF2基因在该区域都存在12G和13G类型,前者比后者少1个密码子,其CDS长为1377 bp;在水牛、牦牛、山羊和绵羊中,该区域只存在13G型,CDS长度均为1380 bp。不同物种间FEZF2基因转录区结构不同,特别是非翻译区 (untranslated region:5′UTR和3′UTR)的长度及内含子长度不一致。在牛科物种中,除瘤牛的FEZF2基因包含2个选择性剪接转录本(它们主要在5′UTR存在差异)外,普通牛、水牛、牦牛、山羊和绵羊均只包含1个转录本。结合表4还可知:水牛FEZF2基因与其他牛科物种的转录区组成与结构差异较大,山羊和绵羊间的转录区组成与结构也相差较大;但牛科物种间FEZF2的CDS区结构组成与共线性关系较为一致,与其他非牛科物种相似性也较大。
表 4 牛科和非牛科动物FEZF2基因结构的比较Table 4. Comparison of FEZF2 gene structure between species of Bovidae and non-Bovidae物种
species染色体位置
chromosome
location外显子数
number of
exon内含子数
number of
intron长度/bp length 5′UTR E1 E2 E3 E4 E5 E6 E7 E8 E9 3′UTR CDS Bubalus bubalis_13G NC_059177.1 9 8 1233 1175 910 135 133 3318 79 64 160 309 3673 1380 Bos taurus_12G NC_037349.1 6 5 219 27 134 907 135 133 681 424 1377 Bos taurus_13G Ensembl 6 5 219 27 134 910 135 133 679 419 1380 Bos indicus_12G NC_032671.1 5 4 295 237 907 135 133 687 430 1377 Bos indicus_13G NC_032671.1 6 5 219 27 134 910 135 133 687 427 1380 Bos taurus
hybrid_13GEnsembl 6 5 921 729 134 910 135 133 715 455 1380 Bos indicus
hybrid_13GEnsembl 6 5 815 623 134 910 135 133 715 455 1380 Bos grunniens_13G Ensembl 6 5 358 166 134 910 135 133 719 459 1380 Capra hircus_13G NC_030829.1 5 4 295 237 910 135 133 688 431 1380 Ovis aries_13G NC_056072.1 5 4 1329 1271 910 135 133 702 455 1380 Camelus dromedarius_22G NC_044527.1 5 4 234 176 928 135 133 654 397 1398 Camelus ferus_24G NC_045712.1 4 3 21 897 135 133 390 133 1404 Equus asinus_16G NW_014638425.1 5 4 282 224 910 135 133 669 413 1380 Equus caballus_19G NC_009159.3 4 3 83 944 135 133 651 394 1389 Cervus hanglu
yarkandensis_14GEnsembl 6 5 281 89 134 913 135 133 718 458 1383 Sus scrofa_17G NC_010455.5 5 4 1276 1218 907 135 133 327 70 1377 Homo sapiens_16G NC_000003.12 5 4 330 272 910 135 133 662 405 1380 Mus musculus_7G NC_000080.6 5 4 332 279 890 135 133 867 607 1368 Felis catus_21G NC_018724.3 6 5 841 778 528 402 135 133 672 415 1395 Panthera leo_19G NC_056680.1 4 3 861 135 133 348 91 1389 Gallus gallus_0G NC_045712.1 4 3 21 856 135 133 534 133 1326 注:E1~E9分别代表外显子1~9。
Note: E1-E9 indicate exons 1-9, respectively.2.2 氨基酸组成、理化特征及结构分析
2.2.1 FEZF2蛋白的氨基酸组成
由表5可知:在氨基酸组成上,牛科物种间相似性较大,与非牛科动物(特别是鸡)的差异较大。在牛科物种中,水牛、普通牛、瘤牛和牦牛间FEZF2蛋白的氨基酸组成相似性较大,它们与山羊和绵羊在丙氨酸、天冬氨酸、谷氨酸、甘氨酸、蛋氨酸、苏氨酸和缬氨酸等氨基酸组成上存在一定差异。
表 5 牛科物种与非牛科动物FEZF2氨基酸组成Table 5. Amino acid composition of FEZF2 in species of Bovidae and non-Bovidae% 氨基酸
amino acidBubalus
bubalis_
13GBos
taurus_
12GBos
taurus_
13GBos
indicus_
12GBos
indicus _
13GBos
grunniens_
13GCapra
hircus_
13GOvis
aries _
13GHomo
sapiens_
16GMus
musculus _
7GGallus
gallus_
0G丙氨酸 Ala 9.6 9.6 9.6 9.6 9.6 9.6 9.2 8.9 10 9.7 9.3 精氨酸 Arg 3.7 3.7 3.7 3.7 3.7 3.7 3.7 3.7 3.7 3.7 4.3 天冬酰胺 Asn 4.1 4.1 4.1 4.4 4.1 4.1 4.1 4.1 4.1 4.2 3.9 天冬氨酸 Asp 1.7 1.7 1.7 1.7 1.7 1.7 2 2 1.7 1.8 1.8 半胱氨酸 Cys 4.8 4.8 4.8 4.6 4.8 4.8 4.8 4.8 4.8 4.8 4.8 谷氨酰胺 Gln 2.8 2.8 2.8 2.8 2.8 2.8 2.8 2.8 2.8 2.9 3.2 谷氨酸 Glu 3.9 3.9 3.9 3.9 3.9 3.9 3.7 3.7 3.9 4.0 4.3 甘氨酸 Gly 10.9 10.7 10.9 10.7 10.9 10.9 11.1 11.1 10.9 8.6 10.2 组氨酸 His 4.8 4.8 4.8 4.8 4.8 4.8 4.8 4.8 4.8 5.1 5.9 异亮氨酸 Ile 2.2 2.2 2.2 2.2 2.2 2.2 2.2 2.2 2.2 2.2 2.9 亮氨酸 Leu 9.6 9.6 9.6 9.6 9.6 9.6 9.6 9.6 9.6 9.5 8.6 赖氨酸 Lys 8.7 8.7 8.7 8.7 8.7 8.7 8.7 8.7 8.7 8.8 9.1 蛋氨酸 Met 1.3 1.5 1.5 1.5 1.5 1.5 1.3 1.3 1.3 1.3 1.4 苯丙氨酸 Phe 4.1 4.1 4.1 4.1 4.1 4.1 4.1 4.1 4.1 4.4 4.3 脯氨酸 Pro 7.8 7.6 7.8 7.9 7.8 7.8 7.8 7.8 8.3 7.9 10.2 丝氨酸 Ser 7.0 7.2 7.0 7.0 7.0 7.0 7.0 7.0 7.0 8.6 5.7 苏氨酸 Thr 5.7 5.7 5.7 5.7 5.7 5.7 5.9 6.1 5.0 5.7 4.1 色氨酸 Trp 0.2 0.2 0.2 0.2 0.2 0.2 0.2 0.2 0.2 0.2 0.2 酪氨酸 Tyr 2.6 2.6 2.6 2.6 2.6 2.6 2.6 2.6 2.6 2.6 2.5 缬氨酸 Val 4.4 4.1 4.1 4.1 4.1 4.1 4.4 4.4 4.1 4.2 3.4 2.2.2 基本理化特征分析
由表6可知:牛科物种FEZF2的基本理化特征基本相似,都是亲水性蛋白质,但水牛属、牛属与羊属动物的属间有一定差异,主要表现在疏水性氨基酸与极性氨基酸的含量、不稳定指数和疏水性等方面。普通牛和瘤牛FEZF2的12G型和13G型除疏水性有一定差异外,其他指标较一致。牛科物种FEZF2的基本理化特征与人和家鼠的特别是与鸡的差异较大。
表 6 牛科及非牛科物种FEZF2的基本理化特征Table 6. Basic physicochemical characteristics of FEZF2 for species of Bovidae and non-Bovidae物种
speciesBubalus
bubalis_
13GBos
taurus_
12GBos
taurus_
13GBos
indicus_
12GBos
indicus_
13GBos
grunniens_
13GCapra
hircus_
13GOvis
aries _
13GHomo
sapiens_
16GMus
musculus_
7GGallus
gallus _
0G氨基酸数量
number of AA459 458 459 458 459 459 459 459 459 455 441 等电点
isolectric point9.52 9.52 9.52 9.55 9.52 9.52 9.52 9.52 9.52 9.52 9.59 分子量/ku
molecular weight48.88 48.84 48.91 48.86 48.91 48.91 48.88 48.91 48.81 48.93 47.62 强酸性氨基酸 (−)
strongly acidic AAs26 26 26 26 26 26 26 26 26 26 27 强碱性氨基酸 (+) strongly basic AAs 57 57 57 57 57 57 57 57 57 57 59 疏水氨基酸
hydrophobic AAs138 137 137 137 137 137 136 135 139 137 127 极性氨基酸
polar AAs124 125 124 124 124 124 125 126 121 131 106 不稳定指数
instability index43.74 44.09 44.28 42.64 44.28 44.28 43.32 42.90 44.90 44.10 43.60 亲水性总平均值
grand average of hydropathicity−0.324 −0.327 −0.329 −0.342 −0.329 −0.329 −0.334 −0.340 −0.328 −0.348 −0.473 脂肪族指数
aliphatic index68.1 67.62 67.47 67.62 67.47 67.47 67.67 67.45 67.91 67.21 64.26 信号肽
signal peptideN N N N N N N N N N N 跨膜区
transmembrane regionN N N N N N N N N N N 注:N. 无该结构。
Note: N. without the structure.2.2.3 FEZF2蛋白的基序和结构域
由图3可知:除猪和鸡的FEZF2蛋白含有9个基序外,其他物种的FEZF2蛋白均含有10个基序。预测结果(表6)显示:牛科和非牛科动物的FEZF2蛋白都不含有跨膜结构和信号肽,但都含有1个COG5048保守结构域,由6个C2H2类型的锌指结构域组成(图3和图4),由基序3、2、9和1构成。牛科与和非牛科动物的FEZF2的COG5048保守结构域所在位置一致,在靠近多肽链的C端一侧(牛科动物在多肽链的AA288~440之间)。人、家鼠和猪除含有1个COG5048保守结构域之外,在AA385~441之间还含有1个SFP1超家族结构域;家鼠在AA317~339之间还有1个zf-H2C2_2结构域。
图 4 预测的牛科动物FEZF2蛋白三级结构注:a) 水牛_13G;b) 普通牛_12G;c)普通牛_13G;d)瘤牛_12G;e)瘤牛_13G;f) 牦牛_13G;g) 绵羊_13G;h) 山羊_13G。Figure 4. Tertiary structure of FEZF2 protein predicted in BovidaeNote: a) Bubalus bubalis_13G; b) Bos taurus_12G; c) Bos taurus_13G; d) Bos indicus_12G; e) Bos indicus_13G; f) Bos grunniens_13G; g) Capra hircus_13G; h) Ovis aries_13G.2.2.4 二级结构组成与三级结构分析
由表7可知:水牛属和牛属动物与羊属动物的FEZF2氨基酸序列中形成各类二级结构的氨基酸数量有一定差异,牛科与非牛科动物差异更大。同源建模显示:构建牛科物种FEZF2蛋白的最佳模型为鼠锌指蛋白568模板(5wjq.1.C)。水牛、普通牛(12/13G)、瘤牛(12/13G)、牦牛和山羊的FEZF2蛋白三维结构与模板一致性为43%,覆盖率为37% (AA275~445之间);绵羊13G的三级结构与5wjq.1.C的覆盖率为37%,一致性为41%,缺少1个锌指结构;预测的模板覆盖区域在COG5048保守结构域区,三维结构显示该区域含有6个典型的锌指结构(绵羊含5个),与结构域分析基本一致。从三维结构来看,牛科物种的属间有一定差异;水牛与普通牛、瘤牛的13G和12G型FEZF2都有差异,但与普通牛13G型差异相对较小(图4)。
表 7 形成各物种FEZF2蛋白二级结构的氨基酸数量占比Table 7. Proportion of amino acids that form the secondary structure of FEZF2 proteins in different species% 物种
speciesα螺旋
alpha helix延伸片段
extended strandβ折叠
beta turn无规则卷
random coilBubalus bubalis_13G 23.97 10.68 4.36 61.00 Bos taurus_12G 23.58 10.48 5.24 60.70 Bos taurus_13G 23.97 10.68 4.36 61.00 Bos indicus_12G 23.58 12.66 5.24 58.52 Bos indicus_13G 23.97 10.68 4.36 61.00 Bos grunniens_13G 23.97 10.68 4.36 61.00 Capra hircus_13G 23.09 11.55 4.79 60.57 Ovis aries_13G 22.22 12.85 4.79 60.13 Homo sapiens_16G 23.75 12.42 4.58 59.26 Mus musculus_7G 23.74 12.53 4.40 59.34 Gallus gallus_0G 24.26 13.15 4.76 57.82 2.3 亚细胞定位、生物学过程及分子功能
亚细胞定位分析表明:各物种FEZF2定位于细胞核内的支持分数值为10 (满分),表明FEZF2蛋白为在细胞核内发挥功能作用的蛋白质。生物信息分析表明:FEZF2蛋白主要参与轴突成束、细胞去分化、细胞群增殖的负调控、神经元分化的负调节、神经元命运的决定和神经元分化的正向调节等生物学过程。它能与染色质结合,具有DNA结合转录激活或抑制因子活性,能激活或抑制RNA聚合酶II转录的特定基因集转录;还具有能与蛋白编码基因顺式调控序列特异性结合的功能。
2.4 蛋白质互作分析
由图5可知:与各牛科物种的FEZF2蛋白相互作用的蛋白不完全相同,其中共有的互作蛋白主要为BCL11B、CUX1、CUX2、ETV1、FOXP2、KCNN2、NEUROG2、NR2E1、OTP、PAX6、SATB2、SLC38A11、SOX5、TBR1和ZFPM2等,主要为参与胸腺细胞发育过程中T淋巴细胞分化和存活的关键调节因子,参与控制大脑中神经元的增殖和分化的转录因子、转录激活或抑制因子,调节神经元的兴奋性钾离子通道,参与神经元分化的转录调节因子,参与调节视网膜发育核受体亚家族2组E成员,参与下丘脑神经内分泌细胞分化的骨同源盒蛋白,在眼睛、鼻子、中枢神经系统和胰腺的发育中起重要作用的转录因子,在核基质或支架相关区域与DNA结合的蛋白,参与软骨细胞分化和软骨形成转录因子,参与皮质发育(包括神经元迁移、板层和区域特征)以及轴突投射过程的转录抑制因子和具有锌指结构的转录调节因子等。
2.5 氨基酸序列一致性与系统发育分析
由图6可知:各牛科物种FEZF2氨基酸序列的一致性在99.7%~100.0%之间;它们与非牛科哺乳动物FEZF2氨基酸序列的一致性在94.1%~99.3%之间;与鸡的序列一致性偏低,在78.9%~ 79.4%之间。各物种FEZF2氨基酸序列间的差异位点及其连续甘氨酸重复区的位置与差异见图7。
由图8可知:在系统发育树上,普通牛、瘤牛、牦牛、中亚马鹿、水牛与山羊、绵羊等聚在一大支,支持率为99%;而人、马、驴、单峰驼、野骆驼、人、家鼠、猫和狮子聚在另一支。
3. 讨论
牛科家养动物是人类奶制品、肉类和畜力的重要来源,在畜牧业经济中占有十分重要的地位。近年研究表明:FEZF2参与动物的神经元发育,是与动物先天免疫和奶牛乳腺炎抗性紧密相关的重要候选基因[1-4,8],但目前对牛科物种FEZF2基因的研究主要针对普通奶牛,对其他牛科家养动物的涉及还十分有限[2-8]。阐明牛科物种FEZF2基因的分子特征、结构、功能及其与非牛科物种的差异,有助于深入理解FEZF2基因与动物神经发育和先天免疫的关联机制,也可为牛科家养动物奶用和肉用性状的抗病育种提供依据。为此,本研究从公共生物大分子数据库和基因组数据库下载了牛科家畜及用于比较的常见非牛科物种的FEZF2基因及其编码蛋白序列,采用生物信息学和比较基因组学方法进行深入的比较分析。结果表明:牛科物种FEZF2基因在CDS长度、碱基组成和CDS结构组成模式上具有较高的一致性;其编码产物的氨基酸组成、序列一致性、理化特征、基序、保守结构域和三维结构等虽具有一定的种属间差异,但一致性非常高,与非牛科动物的一致性也较高。系统发育分析也显示:牛科FEZF2蛋白序列聚集在一大支中,表明牛科家养动物的FEZF2蛋白有着较近的遗传关系。本研究表明:牛科FEZF2蛋白与非牛科哺乳动物具有相似功能,牛科家养动物间一致性更高。
有研究发现:FEZF2蛋白是一种含有C2H2型锌指结构域和连续甘氨酸重复区的转录因子,它能控制单胺能神经元的发育[1,11-12]。FEZF2缺陷的小鼠呈现出过度活跃的行为,揭示FEZF2基因在神经元发育中起作用[7]。SUGIMOTO等[2]报道FEZF2在普通牛大脑中强表达,在乳腺中弱表达。在泌乳期水牛中,FEZF2在大脑中的表达水平最高,在小脑、垂体、心、肺、脾和肾中有较高水平的表达,在乳腺、肌肉、小肠和十二指肠组织中有适量表达[6]。在奶牛中发现,乳腺炎能够诱导乳腺中FEZF2表达,进而上调细胞中SEMA5A表达,进一步引起与机体免疫反应相关的多个基因表达[2,8]。因此,FEZF2基因不仅与神经元发育相关,而且由于神经元发育和免疫之间存在串扰,导致其与先天免疫相关[2,8]。本研究显示:牛科动物FEZF2蛋白都是在核内发挥功能的亲水性蛋白,无信号肽序列及跨膜结构域,都含有1个COG5048保守的锌指结构域,其参与的生物学过程主要与神经元发育调节有关,分子功能主要与染色质结合、转录激活或抑制有关[12-13];与其相互作用的蛋白多为与神经元发育和先天免疫调节密切相关的转录因子或蛋白。结合其在序列和结构上的保守性,推测FEZF2蛋白参与牛科家养动物的神经元发育和与先天免疫相关的生物学过程。
SUGIMOTO等[2,8]研究表明:FEZF2基因中连续甘氨酸重复区的多态性与奶牛乳腺炎抗性相关,但这种多态性对产奶量、乳中脂、蛋白和非脂肪固型物产量的估计育种值无不利影响。该区域13G型等位基因导致奶牛对乳腺炎易感,而12G型等位基因使奶牛对乳腺炎具有抗性,这是因为12G型抗性等位基因促进SEMA5A表达的能力显著强于易感的13G型等位基因,即12G型等位基因引起的免疫应答水平高于13G型的等位基因[2,8]。进一步研究发现:易感的13G型FEZF2含有的甘氨酸重复区能与胰岛素样生长因子1受体(IGF1R)基因5′UTR中较长的胞嘧啶(C)伸展相结合,通过促进IGF1R的表达而抑制乳腺上皮细胞的自噬过程,进而介导对乳腺炎的易感性[3]。携带13G型的FEZF2与5′UTR中含较长C延伸的IGF1R的变异组合的奶牛更容易患乳腺炎[3]。本研究通过序列比对发现:哺乳动物的FEZF2蛋白都存在连续甘氨酸重复区,但各物种间甘氨酸重复的数量有差异。在牛科家养动物中,普通牛和瘤牛的FEZF2在该区域都存在12G和13G型等位基因,而在水牛、牦牛、山羊和绵羊中,该区域只存在13G型等位基因。前期魏伟等[5]对河流型和沼泽型水牛群体检测发现:这两类水牛的FEZF2都为13G型。在水牛、牦牛、山羊和绵羊中,FEZF2蛋白只存在13G型,它是否会导致这些牛科物种乳腺炎易感或先天免疫应答受损有待进一步深入研究。值得注意的是,截至目前,未见沼泽型水牛、牦牛、山羊和绵羊患乳腺炎的报道;奶用河流型水牛乳腺炎的发病率仅约4%,显著低于普通奶牛[14-16]。本研究发现:在氨基酸序列一致性、理化特性和结构上,各牛科物种的FEZF2虽然具有较高的一致性,但仍存在一定的种属间差异,这些差异是否与水牛、牦牛、山羊和绵羊对乳腺炎的抗性有关尚不清楚,因此,有必要通过群体水平的试验观察和进一步的细胞水平功能试验予以证实。
本研究通过序列比对,发现了一些具有种属特征的核苷酸或氨基酸差异位点,这些位点不仅反映了种属间FEZF2功能的差异,而且也可作为种属间相互区分的分子标记。
4. 结论
牛科物种的FEZF2基因编码蛋白在氨基酸组成、序列一致性、理化特征和结构上虽然有种属间差异,但一致性较高。在牛科中,水牛、牦牛、绵羊和山羊FEZF2序列的连续甘氨酸重复区为13G型,而普通牛和瘤牛的同源区有12G和13G型。牛科动物FEZF2蛋白都是在核内发挥生物学功能的亲水性蛋白,都含有1个由6个锌指结构组成的COG5048保守结构域,参与的生物学过程主要与神经元发育调节有关,分子功能主要与染色质结合、转录激活或抑制有关。本研究揭示FEZF2蛋白可能参与了牛科物种神经元发育和机体免疫相关基因的表达调控过程。
-
图 1 牛科物种FEZF2基因核苷酸序列差异
注:物种中文名见表1;“数字+G”表示该物种FEZF2蛋白序列中的甘氨酸重复数;下同。阴影部分为连续的甘氨酸编码区。
Figure 1. Nucleotide sequence differences of FEZF2 gene in species of Bovidae
Note: Chinese name of species list in Tab.1; “number+G” indicates the number of glycine repeats in the FEZF2 protein sequence of species; the same as below. The shaded area is the continuous glycine coding region.
图 4 预测的牛科动物FEZF2蛋白三级结构
注:a) 水牛_13G;b) 普通牛_12G;c)普通牛_13G;d)瘤牛_12G;e)瘤牛_13G;f) 牦牛_13G;g) 绵羊_13G;h) 山羊_13G。
Figure 4. Tertiary structure of FEZF2 protein predicted in Bovidae
Note: a) Bubalus bubalis_13G; b) Bos taurus_12G; c) Bos taurus_13G; d) Bos indicus_12G; e) Bos indicus_13G; f) Bos grunniens_13G; g) Capra hircus_13G; h) Ovis aries_13G.
表 1 FEZF2基因序列的来源
Table 1 Sequence source of FEZF2 gene
基因序列号
accession number of gene sequences蛋白质序列号
accession number of protein sequences物种
species序列来源
source of sequenceXM_045163982.1 XP_045019917.1 水牛 Bubalus bubalis NCBI NM_001038198.2 NP_001033287.1 普通牛 Bos taurus NCBI ENSBTAG00000020302 ENSBTAP00000027056 普通牛 Bos taurus Ensembl XM_019984262.1 XP_019839821.1 瘤牛 Bos indicus NCBI JX312831.1 AFS31067.1 瘤牛 Bos indicus NCBI ENSBIXG00000029646 ENSBIXP00000000579 杂交牛 Bos taurus hybrid Ensembl ENSBIXG00005030934 ENSBIXP00005045927 杂交牛 Bos indicus hybrid Ensembl ENSBGRG00000026510 ENSBGRP00000042330 牦牛 Bos grunniens Ensembl XM_005696081.3 XP_005696138.2 山羊 Capra hircus NCBI XM_004018621.5 XP_004018670.3 绵羊 Ovis aries NCBI XM_010980957.2 XP_010979259.2 单峰驼 Camelus dromedarius NCBI XM_032458017.1 XP_032313908.1 野骆驼 Camelus ferus NCBI XM_014868769.2 XP_014724255.1 驴 Equus asinus NCBI XM_023620158.1 XP_023475926.1 马 Equus caballus NCBI ENSCHYG00000014589 ENSCHYP00000021735 中亚马鹿 Cervus hanglu yarkandensis Ensembl XM_021069124.1 XP_020924783.1 猪 Sus scrofa NCBI NM_018008.4 NP_060478.3 人 Homo sapiens NCBI NM_080433.3 NP_536681.2 家鼠 Mus musculus NCBI XM_023249900.2 XP_023105668.1 猫 Felis catus NCBI XM_042927529.1 XP_042783463.1 狮子 Panthera leo NCBI XM_414411.6 XP_414411.2 鸡 Gallus gallus NCBI 表 2 FEZF2基因编码区碱基组成
Table 2 Base composition in the coding region of FEZF2 gene
物种 species A G T C A+T C+G Bubalus bubalis_13G 21.30 28.26 16.45 33.99 37.75 62.25 Bos taurus_12G 21.42 28.03 16.63 33.91 38.05 61.95 Bos taurus_13G 21.38 28.12 16.59 33.91 37.97 62.30 Bos indicus_12G 21.57 27.96 16.49 33.99 38.05 61.95 Bos indicus_13G 21.38 28.12 16.52 33.99 37.90 62.10 Bos taurus hybrid_13G 21.38 28.12 16.59 33.91 37.97 62.03 Bos indicus hybrid_13G 21.38 28.12 16.52 33.99 37.90 62.10 Bos grunniens_13G 21.38 28.12 16.52 33.99 37.90 62.10 Capra hircus_13G 21.59 28.19 16.30 33.91 37.90 62.10 Ovis aries_13G 21.59 28.19 16.30 33.91 37.90 62.10 Camelus dromedarius_22G 21.10 28.61 16.02 34.26 37.12 62.88 Camelus ferus_24G 20.94 28.92 15.88 34.26 36.82 63.18 Equus asinus_16G 20.72 28.84 15.29 35.14 36.01 63.99 Equus caballus_19G 20.45 29.23 15.19 35.13 35.64 64.36 Cervus hanglu yarkandensis_14G 21.26 28.63 16.05 34.06 37.31 62.69 Sus scrofa_17G 21.35 28.32 16.49 33.84 37.84 62.16 Homo sapiens_16G 21.16 28.41 15.72 34.71 36.88 63.12 Mus musculus_7G 23.10 25.37 18.06 33.48 41.15 58.85 Felis catus_21G 20.57 29.46 15.41 34.55 35.99 64.01 Panthera leo_19G 20.81 29.16 15.48 34.56 36.29 63.71 Gallus gallus_0G 20.36 30.24 13.65 35.75 34.01 65.99 注:物种中文名见表1;“数字+G”表示该物种FEZF2蛋白序列中的甘氨酸重复数;下同。
Note: Chinese name of species list in Tab.1; “number+G” indicates the number of glycine repeats in the FEZF2 amino acid sequence of species; the same as below.表 3 牛科物种FEZF2基因核苷酸序列的一致性
Table 3 Nucleotide sequence consistency of FEZF2 gene between the species of Bovidae and non-Bovidae
% 物种
speciesBubalus
bubalis_
13GBos
taurus_
12GBos
taurus_
13GBos
indicus_
12GBos
indicus_
13GBos
taurus hybrid_
13GBos
indicus hybrid_
13GBos
grunniens_
13GCapra
hircus_
13GOvis
aries_
13GBubalus bubalis_13G *** 99.0 99.7 99.7 99.7 99.0 99.7 99.7 98.7 98.7 Bos taurus_12G 0.8 *** 99.3 99.3 99.4 99.8 99.3 99.3 97.9 97.9 Bos taurus_13G 0.3 0.5 *** 100.0 99.9 99.2 100.0 100.0 98.6 98.6 Bos indicus_12G 0.3 0.5 0.0 *** 99.9 99.2 100.0 100.0 98.6 98.6 Bos indicus_13G 0.4 0.4 0.1 0.1 *** 99.2 99.9 99.9 98.5 98.5 Bos taurus hybrid_13G 0.9 0.2 0.6 0.6 0.7 *** 99.2 99.2 97.8 97.8 Bos indicus hybrid_13G 0.3 0.5 0.0 0.0 0.1 0.6 *** 100.0 98.6 98.6 Bos grunniens_13G 0.3 0.5 0.0 0.0 0.1 0.6 0.0 *** 98.6 98.6 Capra hircus_13G 1.4 2.0 1.5 1.5 1.5 2.1 1.5 1.5 *** 99.9 Ovis aries_13G 1.4 2.0 1.5 1.5 1.5 2.1 1.5 1.5 0.1 *** 注:对角线以上数值表示序列一致性,对角线以下数值代表序列分歧度。
Note: The values above diagonal line indicate the identity, the values below the diagonal indicate divergence.表 4 牛科和非牛科动物FEZF2基因结构的比较
Table 4 Comparison of FEZF2 gene structure between species of Bovidae and non-Bovidae
物种
species染色体位置
chromosome
location外显子数
number of
exon内含子数
number of
intron长度/bp length 5′UTR E1 E2 E3 E4 E5 E6 E7 E8 E9 3′UTR CDS Bubalus bubalis_13G NC_059177.1 9 8 1233 1175 910 135 133 3318 79 64 160 309 3673 1380 Bos taurus_12G NC_037349.1 6 5 219 27 134 907 135 133 681 424 1377 Bos taurus_13G Ensembl 6 5 219 27 134 910 135 133 679 419 1380 Bos indicus_12G NC_032671.1 5 4 295 237 907 135 133 687 430 1377 Bos indicus_13G NC_032671.1 6 5 219 27 134 910 135 133 687 427 1380 Bos taurus
hybrid_13GEnsembl 6 5 921 729 134 910 135 133 715 455 1380 Bos indicus
hybrid_13GEnsembl 6 5 815 623 134 910 135 133 715 455 1380 Bos grunniens_13G Ensembl 6 5 358 166 134 910 135 133 719 459 1380 Capra hircus_13G NC_030829.1 5 4 295 237 910 135 133 688 431 1380 Ovis aries_13G NC_056072.1 5 4 1329 1271 910 135 133 702 455 1380 Camelus dromedarius_22G NC_044527.1 5 4 234 176 928 135 133 654 397 1398 Camelus ferus_24G NC_045712.1 4 3 21 897 135 133 390 133 1404 Equus asinus_16G NW_014638425.1 5 4 282 224 910 135 133 669 413 1380 Equus caballus_19G NC_009159.3 4 3 83 944 135 133 651 394 1389 Cervus hanglu
yarkandensis_14GEnsembl 6 5 281 89 134 913 135 133 718 458 1383 Sus scrofa_17G NC_010455.5 5 4 1276 1218 907 135 133 327 70 1377 Homo sapiens_16G NC_000003.12 5 4 330 272 910 135 133 662 405 1380 Mus musculus_7G NC_000080.6 5 4 332 279 890 135 133 867 607 1368 Felis catus_21G NC_018724.3 6 5 841 778 528 402 135 133 672 415 1395 Panthera leo_19G NC_056680.1 4 3 861 135 133 348 91 1389 Gallus gallus_0G NC_045712.1 4 3 21 856 135 133 534 133 1326 注:E1~E9分别代表外显子1~9。
Note: E1-E9 indicate exons 1-9, respectively.表 5 牛科物种与非牛科动物FEZF2氨基酸组成
Table 5 Amino acid composition of FEZF2 in species of Bovidae and non-Bovidae
% 氨基酸
amino acidBubalus
bubalis_
13GBos
taurus_
12GBos
taurus_
13GBos
indicus_
12GBos
indicus _
13GBos
grunniens_
13GCapra
hircus_
13GOvis
aries _
13GHomo
sapiens_
16GMus
musculus _
7GGallus
gallus_
0G丙氨酸 Ala 9.6 9.6 9.6 9.6 9.6 9.6 9.2 8.9 10 9.7 9.3 精氨酸 Arg 3.7 3.7 3.7 3.7 3.7 3.7 3.7 3.7 3.7 3.7 4.3 天冬酰胺 Asn 4.1 4.1 4.1 4.4 4.1 4.1 4.1 4.1 4.1 4.2 3.9 天冬氨酸 Asp 1.7 1.7 1.7 1.7 1.7 1.7 2 2 1.7 1.8 1.8 半胱氨酸 Cys 4.8 4.8 4.8 4.6 4.8 4.8 4.8 4.8 4.8 4.8 4.8 谷氨酰胺 Gln 2.8 2.8 2.8 2.8 2.8 2.8 2.8 2.8 2.8 2.9 3.2 谷氨酸 Glu 3.9 3.9 3.9 3.9 3.9 3.9 3.7 3.7 3.9 4.0 4.3 甘氨酸 Gly 10.9 10.7 10.9 10.7 10.9 10.9 11.1 11.1 10.9 8.6 10.2 组氨酸 His 4.8 4.8 4.8 4.8 4.8 4.8 4.8 4.8 4.8 5.1 5.9 异亮氨酸 Ile 2.2 2.2 2.2 2.2 2.2 2.2 2.2 2.2 2.2 2.2 2.9 亮氨酸 Leu 9.6 9.6 9.6 9.6 9.6 9.6 9.6 9.6 9.6 9.5 8.6 赖氨酸 Lys 8.7 8.7 8.7 8.7 8.7 8.7 8.7 8.7 8.7 8.8 9.1 蛋氨酸 Met 1.3 1.5 1.5 1.5 1.5 1.5 1.3 1.3 1.3 1.3 1.4 苯丙氨酸 Phe 4.1 4.1 4.1 4.1 4.1 4.1 4.1 4.1 4.1 4.4 4.3 脯氨酸 Pro 7.8 7.6 7.8 7.9 7.8 7.8 7.8 7.8 8.3 7.9 10.2 丝氨酸 Ser 7.0 7.2 7.0 7.0 7.0 7.0 7.0 7.0 7.0 8.6 5.7 苏氨酸 Thr 5.7 5.7 5.7 5.7 5.7 5.7 5.9 6.1 5.0 5.7 4.1 色氨酸 Trp 0.2 0.2 0.2 0.2 0.2 0.2 0.2 0.2 0.2 0.2 0.2 酪氨酸 Tyr 2.6 2.6 2.6 2.6 2.6 2.6 2.6 2.6 2.6 2.6 2.5 缬氨酸 Val 4.4 4.1 4.1 4.1 4.1 4.1 4.4 4.4 4.1 4.2 3.4 表 6 牛科及非牛科物种FEZF2的基本理化特征
Table 6 Basic physicochemical characteristics of FEZF2 for species of Bovidae and non-Bovidae
物种
speciesBubalus
bubalis_
13GBos
taurus_
12GBos
taurus_
13GBos
indicus_
12GBos
indicus_
13GBos
grunniens_
13GCapra
hircus_
13GOvis
aries _
13GHomo
sapiens_
16GMus
musculus_
7GGallus
gallus _
0G氨基酸数量
number of AA459 458 459 458 459 459 459 459 459 455 441 等电点
isolectric point9.52 9.52 9.52 9.55 9.52 9.52 9.52 9.52 9.52 9.52 9.59 分子量/ku
molecular weight48.88 48.84 48.91 48.86 48.91 48.91 48.88 48.91 48.81 48.93 47.62 强酸性氨基酸 (−)
strongly acidic AAs26 26 26 26 26 26 26 26 26 26 27 强碱性氨基酸 (+) strongly basic AAs 57 57 57 57 57 57 57 57 57 57 59 疏水氨基酸
hydrophobic AAs138 137 137 137 137 137 136 135 139 137 127 极性氨基酸
polar AAs124 125 124 124 124 124 125 126 121 131 106 不稳定指数
instability index43.74 44.09 44.28 42.64 44.28 44.28 43.32 42.90 44.90 44.10 43.60 亲水性总平均值
grand average of hydropathicity−0.324 −0.327 −0.329 −0.342 −0.329 −0.329 −0.334 −0.340 −0.328 −0.348 −0.473 脂肪族指数
aliphatic index68.1 67.62 67.47 67.62 67.47 67.47 67.67 67.45 67.91 67.21 64.26 信号肽
signal peptideN N N N N N N N N N N 跨膜区
transmembrane regionN N N N N N N N N N N 注:N. 无该结构。
Note: N. without the structure.表 7 形成各物种FEZF2蛋白二级结构的氨基酸数量占比
Table 7 Proportion of amino acids that form the secondary structure of FEZF2 proteins in different species
% 物种
speciesα螺旋
alpha helix延伸片段
extended strandβ折叠
beta turn无规则卷
random coilBubalus bubalis_13G 23.97 10.68 4.36 61.00 Bos taurus_12G 23.58 10.48 5.24 60.70 Bos taurus_13G 23.97 10.68 4.36 61.00 Bos indicus_12G 23.58 12.66 5.24 58.52 Bos indicus_13G 23.97 10.68 4.36 61.00 Bos grunniens_13G 23.97 10.68 4.36 61.00 Capra hircus_13G 23.09 11.55 4.79 60.57 Ovis aries_13G 22.22 12.85 4.79 60.13 Homo sapiens_16G 23.75 12.42 4.58 59.26 Mus musculus_7G 23.74 12.53 4.40 59.34 Gallus gallus_0G 24.26 13.15 4.76 57.82 -
[1] MATSUO-TAKASAKI M, LIM J H, BEANAN M J, et al. Cloning and expression of a novel zinc finger gene, Fez, transcribed in the forebrain of Xenopus and mouse embryos[J]. Mechanisms of Development, 2000, 93(1/2): 201. DOI: 10.1016/s0925-4773(00)00264-1.
[2] SUGIMOTO M, FUJIKAWA A, WOMACK J E, et al. Evidence that bovine forebrain embryonic zinc finger-like gene influences immune response associated with mastitis resistance[J]. Proceedings of the National Academy of Sciences, 2006, 103(17): 6454. DOI: 10.1073/pnas.0601015103.
[3] SUGIMOTO M, SUGIMOTO Y. Variant in the 5′ untranslated region of insulin-like growth factor 1 receptor is associated with susceptibility to mastitis in cattle[J]. Genetics, 2012, 2(9): 1077. DOI: 10.1534/g3.112.003095.
[4] 魏伟, 苗永旺. 奶牛乳腺炎抗性候选基因多态性研究进展[J]. 中国牛业科学, 2011, 37(6): 49. DOI: 10.3969/j.issn.1001-9111.2011.06.017. [5] 魏伟, 苗永旺, 李卫真, 等. 水牛前脑锌指蛋白(FEZL)基因外显子1多态性研究[J]. 家畜生态学报, 2011, 32(6): 21. DOI: 10.3969/j.issn.1673-1182.2011.06.005. [6] 张广乐, 吉丽, 王昌全, 等. 槟榔江水牛FEZL基因分离鉴定、分子特征及泌乳期多组织差异表达分析[J]. 家畜生态学报, 2020, 41(12): 13. DOI: 10.3969/j.issn.1673-1182.2020.12.003. [7] HIRATA T. Zinc finger gene fez-like functions in the formation of subplate neurons and thalamocortical axons[J]. Developmental Dynamics, 2004, 230(3): 546. DOI: 10.1002/dvdy.20068.
[8] SUGIMOTO M, ITOH T, GOTOH Y, et al. Short communication: enhanced clinical mastitis resistance in holsteins with a FEZF2 p. Gly105 (12_13) polymorphism[J]. Journal of Dairy Science, 2011, 94(4): 2103. DOI: 10.3168/jds.2010-3362.
[9] KUMAR S, STECHER G, TAMURA K. MEGA7: molecular evolutionary genetics analysis version 7.0 for bigger datasets[J]. Molecular Biology and Evolution, 2016, 33(7): 1870. DOI: 10.1093/molbev/msw054.
[10] CHEN C J, CHEN H, ZHANG Y, et al. TBtools: an integrative toolkit developed for interactive analyses of big biological data[J]. Molecular Plant, 2020, 13(8): 1194. DOI: 10.1016/j.molp.2020.06.009.
[11] LEVKOWITZ G, ZELLER J, SIROTKIN H I, et al. Zinc finger protein too few controls the development of monoaminergic neurons[J]. Nature Neuroscience, 2003, 6(1): 28. DOI: 10.1038/nn979.
[12] TSYPORIN J, TASTAD D, MA X K, et al. Transcriptional repression by FEZF2 restricts alternative identities of cortical projection neurons[J]. Cell Reports, 2021, 35(12): 109269. DOI: 10.1016/j.celrep.2021.109269.
[13] HOBERT O, KRATSIOS P. Neuronal identity control by terminal selectors in worms, flies, and chordates[J]. Current Opinion in Neurobiology, 2019, 56: 97. DOI: 10.1016/j.conb.2018.12.006.
[14] KAVITHA K L, RAJESH K, SURESH K, et a1. Buffalo mastitis-risk factors[J]. Buffalo Bulletin, 2009, 28(3): 135. DOI: 10.1016/j.applanim.2009.07.007.
[15] FAGIOLO A, LAI O. Mastitis in buffalo[J]. Italian Journal of Animal Science, 2010, 6(2): 200. DOI: 10.4081/ijas.2007.s2.200.
[16] BEHESHTI R, ESHRATKHAH B, SHAYEGH J, et al. Prevalence and etiology of subclinical mastitis in Buffalo of the Tabriz region, Iran[J]. Journal of American Science, 2011, 7(5): 642.
-
期刊类型引用(1)
1. 李亚芬,刀文彬,范新阳,苗永旺. 鸡Ⅱ型角蛋白基因家族成员鉴定及其功能的生物信息学分析. 云南农业大学学报(自然科学). 2024(06): 34-47 . 百度学术
其他类型引用(0)