• 中国科学引文数据库(CSCD)来源期刊
  • 中文核心期刊
  • 中国农林核心期刊(A类)
  • 中国高校百佳科技期刊

牛科物种FEZF2基因分子特征、功能预测及进化分析

保志鹏, 涂兴调, 张自芳, 谷丽娇, 范新阳, 钱林东, 苗永旺

保志鹏, 涂兴调, 张自芳, 等. 牛科物种FEZF2基因分子特征、功能预测及进化分析[J]. 云南农业大学学报(自然科学), 2022, 37(4): 574-586. DOI: 10.12101/j.issn.1004-390X(n).202203009
引用本文: 保志鹏, 涂兴调, 张自芳, 等. 牛科物种FEZF2基因分子特征、功能预测及进化分析[J]. 云南农业大学学报(自然科学), 2022, 37(4): 574-586. DOI: 10.12101/j.issn.1004-390X(n).202203009
Zhipeng BAO, Xingtiao TU, Zifang ZHANG, et al. Molecular Characterization, Functional Prediction and Evolutionary Analysis of FEZF2 Gene in Species of Bovidae[J]. JOURNAL OF YUNNAN AGRICULTURAL UNIVERSITY(Natural Science), 2022, 37(4): 574-586. DOI: 10.12101/j.issn.1004-390X(n).202203009
Citation: Zhipeng BAO, Xingtiao TU, Zifang ZHANG, et al. Molecular Characterization, Functional Prediction and Evolutionary Analysis of FEZF2 Gene in Species of Bovidae[J]. JOURNAL OF YUNNAN AGRICULTURAL UNIVERSITY(Natural Science), 2022, 37(4): 574-586. DOI: 10.12101/j.issn.1004-390X(n).202203009

牛科物种FEZF2基因分子特征、功能预测及进化分析

基金项目: 云南省教育厅科学研究基金项目(2018JS581);国家自然科学基金项目(31760659)。
详细信息
    作者简介:

    #对本文贡献等同,为并列第一作者。保志鹏(1983—),女,云南鲁甸人,硕士,副教授,主要从事畜牧兽医学研究。E-mail:171257835@qq.com

    涂兴调(1997—),女,云南罗平人,在读硕士研究生,主要从事动物遗传学研究。E-mail:3154986138@qq.com

    通信作者:

    苗永旺(1964—),男,内蒙古通辽人,博士,教授,主要从事动物遗传学研究。E-mail:yongwangmiao1@126.com

摘要:
目的揭示牛科物种FEZF2基因的功能及其差异。
方法从NCBI和Ensembl数据库下载牛科主要家畜FEZF2基因序列及用于比较的非牛科物种的同源序列,采用生物信息学和比较基因组学方法对牛科家畜FEZF2基因的结构、编码蛋白的理化特征、氨基酸组成、基序和保守结构域、高级结构、参与的生物学路径、分子功能及进化关系进行比较分析。
结果牛科动物间FEZF2基因转录区的结构存在差异,表现为非翻译区和内含子的序列长度不一致,但它们的编码序列(coding sequence,CDS)结构模式一致,与非牛科动物的CDS结构具有共线性关系。牛科动物FEZF2蛋白都是在核内发挥生物学功能的亲水性蛋白,无信号肽序列及跨膜结构域,都含有1个COG5048保守的锌指结构域。预测显示:FEZF2蛋白参与的生物学过程主要与神经元发育调节有关,分子功能主要是与染色质结合、转录激活或抑制有关。牛科与非牛科哺乳动物的FEZF2序列都存在1个连续的甘氨酸序列重复区,水牛、牦牛、绵羊和山羊均为13G型,但普通牛和瘤牛存在12G和13G两个等位基因。各牛科物种FEZF2蛋白在氨基酸组成、序列一致性、理化特征、基序、结构域和高级结构上存在相似性,但在牛科的不同属间存在一定差异。系统发育分析显示:牛科同属动物的FEZF2蛋白遗传关系较近。
结论本研究揭示牛科家畜间FEZF2基因CDS的结构模式高度一致;FEZF2作为核内功能蛋白可能参与了牛科物种的神经元发育和机体免疫等过程的基因表达调控。

 

Molecular Characterization, Functional Prediction and Evolutionary Analysis of FEZF2 Gene in Species of Bovidae

Abstract:
PurposeTo reveal the functions and differences of FEZF2 gene in species of Bovidae family.
MethodsThe sequences of FEZF2 gene in domestic animals of Bovidae and homologous sequences of non-Bovidae species for comparison were downloaded from NCBI and Ensembl databases, the structure of FEZF2 gene, and the physicochemical characteristics, amino acid composition, motifs and conserved domains, advanced structures, biological pathways involved, molecular functions and evolutionary relationships of its encoded proteins were compared and analyzed using the methods of bioinformatics and comparative genomics.
ResultsThe structure of the transcription region of FEZF2 gene is different among species of Bovidae, which mainly shows that the sequence length of the untranslated regions and introns is inconsistent. However, the structural pattern of their coding sequence (CDS) is consistent, which displays collinearity with the CDS structure of non-Bovidae animals. FEZF2 protein of Bovidae species is a hydrophilic protein without a signal peptide sequence and a transmembrane domain that performs biological functions in the nucleus, and contains a conserved zinc finger domain of COG5048. The prediction showed that the biological process involved in this protein is mainly related to the regulation of neuronal development, and the molecular function is mainly related to chromatin binding, transcriptional activation or inhibition. There is a continuous glycine repeat region in FEZF2 sequences of Bovidae and non-Bovidae mammals. Buffalo, yak, sheep and goat are all 13G type, but cattle and zebu have two alleles of 12G and 13G. The amino acid composition, sequence consistency, physicochemical characteristics, motifs, domains and advanced structures of FEZF2 protein among the species of Bovidae are similar, but there are some differences among different genera of Bovidae. Phylogenetic analysis showed that the FEZF2 proteins of the same genus of Bovidae are closely related to each other.
ConclusionThis study reveals that the structural pattern of FEZF2 gene CDS is highly consistent among the domestic animals of Bovidae. As a nuclear functional protein, FEZF2 may be involved in the regulation of gene expression in neuronal development and body immunity in the species of Bovidae.

 

  • FEZ家族锌指蛋白2 (FEZ family zinc finger protein 2,FEZF2)又称前脑胚胎锌指样蛋白2 (forebrain embryonic zinc finger-like protein 2),是锌指蛋白超基因家族的重要成员,包含6个C2H2锌指结构和1个甘氨酸重复区域[1-5]。FEZF2作为一种转录激活/抑制因子,参与神经元发育的转录调控[1-4]。研究发现:动物神经元发育通过下游细胞因子的表达与机体免疫关联[2,5-7]。奶牛乳腺炎的易感性与信号素5A (semaphorin 5A,SEMA5A)的转录活性下降而导致的免疫反应受损有关[2]。乳腺炎可诱导FEZF2基因在乳腺中表达,导致SEMA5A的表达上调,进而诱导与机体免疫相关的TNF-αIL-8等多个基因表达[2]。在乳腺炎中,FEZF2均能诱导SEMA5A表达上调,但在易感奶牛中其表达水平低于乳腺炎抗性牛[2]。在奶牛中发现:FEZF2基因编码产物的多个甘氨酸残基重复区存在12G重复和13G重复2种等位基因,13G型的FEZF2等位基因降低了SEMA5A的表达水平,导致13G/13G基因型奶牛对乳腺炎易感,发病率是12G/12G 基因型奶牛的2倍[8]FEZF2基因位于普通牛第22号染色体,包含6个外显子和5个内含子,编码序列 (coding sequence,CDS)全长为1380 bp (登录号:NM_001038198.2);水牛FEZF2基因定位于第21号染色体,包含9个外显子和8个内含子,CDS全长也为1380 bp (登录号:XM_045163982.1)。魏伟等[5]对河流型和沼泽型水牛群体FEZF2基因的检测发现:河流型水牛中存在c.165G>A,属于同义替换,且河流型与沼泽型水牛的FEZF2基因多个甘氨酸残基重复编码区都为13G型。张广乐等[6]研究发现:FEZF2基因在12个水牛组织中都有表达,其中在大脑的表达量最高,该基因可能在水牛中作为一类核内转录因子广泛参与基因的表达调控过程。FEZF2分别位于山羊的第22号、绵羊的第19号染色体上,它们都含有5个外显子和4个内含子,编码区长度与普通牛和水牛基本一致。

    牛科家养动物包括普通牛、水牛、牦牛、绵羊和山羊等,具有奶用、肉用和役用等多种用途,在全球畜牧业生产中发挥着重要作用。FEZF2作为一种转录因子,参与神经元的发育,可能与动物的先天免疫和奶牛的乳腺炎紧密相关[1-4],但目前有关牛科物种FEZF2基因的研究还十分有限。基于此,本研究从NCBI和Ensembl数据库下载牛科家畜FEZF2基因及其编码蛋白序列,并以下载的非牛科动物的同源序列为对照,采用生物信息学和比较基因组学方法,对牛科主要家畜FEZF2基因的结构、编码蛋白的氨基酸组成、理化特征、结构、进化关系、参与的生物学路径及分子功能等进行深入的比较分析,旨在解析牛科物种FEZF2基因的分子特征、基本功能及进化关系,为深入研究FEZF2基因调控动物免疫的机制和牛科家养动物的抗病育种提供参考。

    用于数据分析的水牛、普通牛、瘤牛、杂交牛、牦牛、山羊和绵羊等牛科物种的FEZF2基因及其编码蛋白序列以及用于比较分析的一些非牛科动物的同源序列,均从NCBI数据库(https://www.ncbi.nlm.nih.gov/)和Ensembl数据库(http://asia.ensembl.org/index.html)下载。经初步比较分析,过滤不完整的序列或可能存在错误的序列后,用于本研究的序列数据信息见表1。用于数据分析的各物种基因组注释GTF文件由NCBI基因组数据库(https://www.ncbi.nlm.nih.gov/genome/?term=)下载得到。

    表  1  FEZF2基因序列的来源
    Table  1.  Sequence source of FEZF2 gene
    基因序列号
    accession number of gene sequences
    蛋白质序列号
    accession number of protein sequences
    物种
    species
    序列来源
    source of sequence
    XM_045163982.1 XP_045019917.1 水牛 Bubalus bubalis NCBI
    NM_001038198.2 NP_001033287.1 普通牛 Bos taurus NCBI
    ENSBTAG00000020302 ENSBTAP00000027056 普通牛 Bos taurus Ensembl
    XM_019984262.1 XP_019839821.1 瘤牛 Bos indicus NCBI
    JX312831.1 AFS31067.1 瘤牛 Bos indicus NCBI
    ENSBIXG00000029646 ENSBIXP00000000579 杂交牛 Bos taurus hybrid Ensembl
    ENSBIXG00005030934 ENSBIXP00005045927 杂交牛 Bos indicus hybrid Ensembl
    ENSBGRG00000026510 ENSBGRP00000042330 牦牛 Bos grunniens Ensembl
    XM_005696081.3 XP_005696138.2 山羊 Capra hircus NCBI
    XM_004018621.5 XP_004018670.3 绵羊 Ovis aries NCBI
    XM_010980957.2 XP_010979259.2 单峰驼 Camelus dromedarius NCBI
    XM_032458017.1 XP_032313908.1 野骆驼 Camelus ferus NCBI
    XM_014868769.2 XP_014724255.1 Equus asinus NCBI
    XM_023620158.1 XP_023475926.1 Equus caballus NCBI
    ENSCHYG00000014589 ENSCHYP00000021735 中亚马鹿 Cervus hanglu yarkandensis Ensembl
    XM_021069124.1 XP_020924783.1 Sus scrofa NCBI
    NM_018008.4 NP_060478.3 Homo sapiens NCBI
    NM_080433.3 NP_536681.2 家鼠 Mus musculus NCBI
    XM_023249900.2 XP_023105668.1 Felis catus NCBI
    XM_042927529.1 XP_042783463.1 狮子 Panthera leo NCBI
    XM_414411.6 XP_414411.2 Gallus gallus NCBI
    下载: 导出CSV 
    | 显示表格

    从NCBI数据库下载各物种FEZF2基因的核苷酸序列,然后用ORF Finder程序(https://www.ncbi.nlm.nih.gov/orffinder/)通过开放阅读框(open reading frame,ORF)查找确定每条序列的CDS,进一步利用Lasergene软件包(DNAStar Inc.,USA)中的MegAlign程序分析各物种序列的一致性;FEZF2基因的碱基组成和核苷酸序列差异采用MEGA 7[9]进行计算或输出。从NCBI数据库下载牛科家畜及常见非牛科动物的基因组注释GTF文件,使用TBtools软件[10]对每个物种的FEZF2基因转录本进行信息完整化处理,进一步使用在线软件Gene Structure Display Server (http://gsds.gao-ab.org/)对每个物种的基因转录区域结构进行可视化。

    从NCBI数据库下载FEZF2基因的氨基酸序列,利用MegAlign程序分析各物种的序列一致性;采用MEGA 7[9]分析氨基酸序列差异并构建FEZF2蛋白氨基酸序列的系统发育树;将FEZF2蛋白氨基酸序列提交至MEME Suite网站(https://meme-suite.org/meme/)获得其基序结构信息;将各物种蛋白序列提交至NCBI的Conserved Domains数据库(https://www.ncbi.nlm.nih.gov/Structure/bwrpsb/bwrpsb.cgi)获得保守结构域。采用TBtools程序整合基序和保守结构域的分析结果。序列一致性、基序和保守结构域分析所使用的序列与基因结构分析使用的序列相对应。

    FEZF2蛋白的理化特征与疏水性、信号肽和跨膜结构域采用在线软件ProtParam (https://web.expasy.org/protparam/)、ProtScale (https://web.expasy.org/protscale/)、SignalP 5.0 server (http://www.cbs.dtu.dk/services/SignalP/)和TMHMM 2.0 server (http://www.cbs.dtu.dk/services/TMHMM/)分别进行预测;蛋白质亚细胞定位及其二级和三级结构分别采用在线软件ProtComp (http://linux1.softberry.com/berry.phtml)、SOPMA (http://npsa-pbil.ibcp.fr/)和SWISS-MODEL (http://swissmodel.expasy.org/)进行分析。与FEZF2蛋白相互作用的蛋白、FEZF2参与的生物学过程和分子功能分别使用在线工具STRING (https://string-db.org/)和InterPro (http://www.ebi.ac.uk/interpro/search/sequence-search)进行分析。

    表2可知:牛科物种间FEZF2基因编码区的碱基组成相似,与非牛科物种的编码区碱基组成差异较大。在牛科物种中,表现为牛属和羊属动物的属内一致性更高,水牛与牛属和羊属动物有一定差异。由表3图1可知:在FEZF2基因编码区序列一致性上,牛科物种间序列一致性在97.8%~100.0%之间,序列差异性较小;牛科与非牛科哺乳动物序列一致性在88.5%~98.2%之间,序列间差异相对较大;牛科物种与鸡的序列一致性仅在71.8%~72.1%之间,序列差异性最大。值得注意的是,牛科物种FEZF2基因CDS第313~351位核苷酸之间存在1个编码连续甘氨酸的序列区,该区域存在长度多态性,有12G (编码12个连续的甘氨酸)和13G (编码13个连续的甘氨酸) 2种类型,两者在长度上相差1个密码子。除鸡外,非牛科物种在第303位核苷酸之后也存在这个连续编码甘氨酸的序列区,但该区域在非牛科物种间长度差异较大,与牛科物种也不一致。核苷酸位点c.247A、c.480T和c.537T是牛属动物与水牛和羊属动物相互区分的核苷酸位点;c.771T是水牛与牛属动物和羊属动物相互区分的核苷酸位点。

    图  1  牛科物种FEZF2基因核苷酸序列差异
    注:物种中文名见表1;“数字+G”表示该物种FEZF2蛋白序列中的甘氨酸重复数;下同。阴影部分为连续的甘氨酸编码区。
    Figure  1.  Nucleotide sequence differences of FEZF2 gene in species of Bovidae
    Note: Chinese name of species list in Tab.1; “number+G” indicates the number of glycine repeats in the FEZF2 protein sequence of species; the same as below. The shaded area is the continuous glycine coding region.
    表  2  FEZF2基因编码区碱基组成
    Table  2.  Base composition in the coding region of FEZF2 gene
    物种 speciesAGTCA+TC+G
    Bubalus bubalis_13G 21.30 28.26 16.45 33.99 37.75 62.25
    Bos taurus_12G 21.42 28.03 16.63 33.91 38.05 61.95
    Bos taurus_13G 21.38 28.12 16.59 33.91 37.97 62.30
    Bos indicus_12G 21.57 27.96 16.49 33.99 38.05 61.95
    Bos indicus_13G 21.38 28.12 16.52 33.99 37.90 62.10
    Bos taurus hybrid_13G 21.38 28.12 16.59 33.91 37.97 62.03
    Bos indicus hybrid_13G 21.38 28.12 16.52 33.99 37.90 62.10
    Bos grunniens_13G 21.38 28.12 16.52 33.99 37.90 62.10
    Capra hircus_13G 21.59 28.19 16.30 33.91 37.90 62.10
    Ovis aries_13G 21.59 28.19 16.30 33.91 37.90 62.10
    Camelus dromedarius_22G 21.10 28.61 16.02 34.26 37.12 62.88
    Camelus ferus_24G 20.94 28.92 15.88 34.26 36.82 63.18
    Equus asinus_16G 20.72 28.84 15.29 35.14 36.01 63.99
    Equus caballus_19G 20.45 29.23 15.19 35.13 35.64 64.36
    Cervus hanglu yarkandensis_14G 21.26 28.63 16.05 34.06 37.31 62.69
    Sus scrofa_17G 21.35 28.32 16.49 33.84 37.84 62.16
    Homo sapiens_16G 21.16 28.41 15.72 34.71 36.88 63.12
    Mus musculus_7G 23.10 25.37 18.06 33.48 41.15 58.85
    Felis catus_21G 20.57 29.46 15.41 34.55 35.99 64.01
    Panthera leo_19G 20.81 29.16 15.48 34.56 36.29 63.71
    Gallus gallus_0G 20.36 30.24 13.65 35.75 34.01 65.99
    注:物种中文名见表1;“数字+G”表示该物种FEZF2蛋白序列中的甘氨酸重复数;下同。
    Note: Chinese name of species list in Tab.1; “number+G” indicates the number of glycine repeats in the FEZF2 amino acid sequence of species; the same as below.
    下载: 导出CSV 
    | 显示表格
    表  3  牛科物种FEZF2基因核苷酸序列的一致性
    Table  3.  Nucleotide sequence consistency of FEZF2 gene between the species of Bovidae and non-Bovidae %
    物种
    species
    Bubalus
    bubalis_
    13G
    Bos
    taurus_
    12G
    Bos
    taurus_
    13G
    Bos
    indicus_
    12G
    Bos
    indicus_
    13G
    Bos
    taurus hybrid_
    13G
    Bos
    indicus hybrid_
    13G
    Bos
    grunniens_
    13G
    Capra
    hircus_
    13G
    Ovis
    aries_
    13G
    Bubalus bubalis_13G *** 99.0 99.7 99.7 99.7 99.0 99.7 99.7 98.7 98.7
    Bos taurus_12G 0.8 *** 99.3 99.3 99.4 99.8 99.3 99.3 97.9 97.9
    Bos taurus_13G 0.3 0.5 *** 100.0 99.9 99.2 100.0 100.0 98.6 98.6
    Bos indicus_12G 0.3 0.5 0.0 *** 99.9 99.2 100.0 100.0 98.6 98.6
    Bos indicus_13G 0.4 0.4 0.1 0.1 *** 99.2 99.9 99.9 98.5 98.5
    Bos taurus hybrid_13G 0.9 0.2 0.6 0.6 0.7 *** 99.2 99.2 97.8 97.8
    Bos indicus hybrid_13G 0.3 0.5 0.0 0.0 0.1 0.6 *** 100.0 98.6 98.6
    Bos grunniens_13G 0.3 0.5 0.0 0.0 0.1 0.6 0.0 *** 98.6 98.6
    Capra hircus_13G 1.4 2.0 1.5 1.5 1.5 2.1 1.5 1.5 *** 99.9
    Ovis aries_13G 1.4 2.0 1.5 1.5 1.5 2.1 1.5 1.5 0.1 ***
    注:对角线以上数值表示序列一致性,对角线以下数值代表序列分歧度。
    Note: The values above diagonal line indicate the identity, the values below the diagonal indicate divergence.
    下载: 导出CSV 
    | 显示表格

    图2可知:牛科物种FEZF2基因的CDS长度由于在多个连续甘氨酸残基编码区存在长度多态性而略有不同。普通牛和瘤牛的FEZF2基因在该区域都存在12G和13G类型,前者比后者少1个密码子,其CDS长为1377 bp;在水牛、牦牛、山羊和绵羊中,该区域只存在13G型,CDS长度均为1380 bp。不同物种间FEZF2基因转录区结构不同,特别是非翻译区 (untranslated region:5′UTR和3′UTR)的长度及内含子长度不一致。在牛科物种中,除瘤牛的FEZF2基因包含2个选择性剪接转录本(它们主要在5′UTR存在差异)外,普通牛、水牛、牦牛、山羊和绵羊均只包含1个转录本。结合表4还可知:水牛FEZF2基因与其他牛科物种的转录区组成与结构差异较大,山羊和绵羊间的转录区组成与结构也相差较大;但牛科物种间FEZF2的CDS区结构组成与共线性关系较为一致,与其他非牛科物种相似性也较大。

    图  2  牛科物种及非牛科动物的FEZF2基因结构
    Figure  2.  Structure of FEZF2 gene in Bovidae and non-Bovidae
    表  4  牛科和非牛科动物FEZF2基因结构的比较
    Table  4.  Comparison of FEZF2 gene structure between species of Bovidae and non-Bovidae
    物种
    species
    染色体位置
    chromosome
    location
    外显子数
    number of
    exon
    内含子数
    number of
    intron
    长度/bp length
    5′UTRE1E2E3E4E5E6E7E8E93′UTRCDS
    Bubalus bubalis_13G NC_059177.1 9 8 1233 1175 910 135 133 3318 79 64 160 309 3673 1380
    Bos taurus_12G NC_037349.1 6 5 219 27 134 907 135 133 681 424 1377
    Bos taurus_13G Ensembl 6 5 219 27 134 910 135 133 679 419 1380
    Bos indicus_12G NC_032671.1 5 4 295 237 907 135 133 687 430 1377
    Bos indicus_13G NC_032671.1 6 5 219 27 134 910 135 133 687 427 1380
    Bos taurus
    hybrid_13G
    Ensembl 6 5 921 729 134 910 135 133 715 455 1380
    Bos indicus
    hybrid_13G
    Ensembl 6 5 815 623 134 910 135 133 715 455 1380
    Bos grunniens_13G Ensembl 6 5 358 166 134 910 135 133 719 459 1380
    Capra hircus_13G NC_030829.1 5 4 295 237 910 135 133 688 431 1380
    Ovis aries_13G NC_056072.1 5 4 1329 1271 910 135 133 702 455 1380
    Camelus dromedarius_22G NC_044527.1 5 4 234 176 928 135 133 654 397 1398
    Camelus ferus_24G NC_045712.1 4 3 21 897 135 133 390 133 1404
    Equus asinus_16G NW_014638425.1 5 4 282 224 910 135 133 669 413 1380
    Equus caballus_19G NC_009159.3 4 3 83 944 135 133 651 394 1389
    Cervus hanglu
    yarkandensis_14G
    Ensembl 6 5 281 89 134 913 135 133 718 458 1383
    Sus scrofa_17G NC_010455.5 5 4 1276 1218 907 135 133 327 70 1377
    Homo sapiens_16G NC_000003.12 5 4 330 272 910 135 133 662 405 1380
    Mus musculus_7G NC_000080.6 5 4 332 279 890 135 133 867 607 1368
    Felis catus_21G NC_018724.3 6 5 841 778 528 402 135 133 672 415 1395
    Panthera leo_19G NC_056680.1 4 3 861 135 133 348 91 1389
    Gallus gallus_0G NC_045712.1 4 3 21 856 135 133 534 133 1326
    注:E1~E9分别代表外显子1~9。
    Note: E1-E9 indicate exons 1-9, respectively.
    下载: 导出CSV 
    | 显示表格

    表5可知:在氨基酸组成上,牛科物种间相似性较大,与非牛科动物(特别是鸡)的差异较大。在牛科物种中,水牛、普通牛、瘤牛和牦牛间FEZF2蛋白的氨基酸组成相似性较大,它们与山羊和绵羊在丙氨酸、天冬氨酸、谷氨酸、甘氨酸、蛋氨酸、苏氨酸和缬氨酸等氨基酸组成上存在一定差异。

    表  5  牛科物种与非牛科动物FEZF2氨基酸组成
    Table  5.  Amino acid composition of FEZF2 in species of Bovidae and non-Bovidae %
    氨基酸
    amino acid
    Bubalus
    bubalis_
    13G
    Bos
    taurus_
    12G
    Bos
    taurus_
    13G
    Bos
    indicus_
    12G
    Bos
    indicus _
    13G
    Bos
    grunniens_
    13G
    Capra
    hircus_
    13G
    Ovis
    aries _
    13G
    Homo
    sapiens_
    16G
    Mus
    musculus _
    7G
    Gallus
    gallus_
    0G
    丙氨酸 Ala 9.6 9.6 9.6 9.6 9.6 9.6 9.2 8.9 10 9.7 9.3
    精氨酸 Arg 3.7 3.7 3.7 3.7 3.7 3.7 3.7 3.7 3.7 3.7 4.3
    天冬酰胺 Asn 4.1 4.1 4.1 4.4 4.1 4.1 4.1 4.1 4.1 4.2 3.9
    天冬氨酸 Asp 1.7 1.7 1.7 1.7 1.7 1.7 2 2 1.7 1.8 1.8
    半胱氨酸 Cys 4.8 4.8 4.8 4.6 4.8 4.8 4.8 4.8 4.8 4.8 4.8
    谷氨酰胺 Gln 2.8 2.8 2.8 2.8 2.8 2.8 2.8 2.8 2.8 2.9 3.2
    谷氨酸 Glu 3.9 3.9 3.9 3.9 3.9 3.9 3.7 3.7 3.9 4.0 4.3
    甘氨酸 Gly 10.9 10.7 10.9 10.7 10.9 10.9 11.1 11.1 10.9 8.6 10.2
    组氨酸 His 4.8 4.8 4.8 4.8 4.8 4.8 4.8 4.8 4.8 5.1 5.9
    异亮氨酸 Ile 2.2 2.2 2.2 2.2 2.2 2.2 2.2 2.2 2.2 2.2 2.9
    亮氨酸 Leu 9.6 9.6 9.6 9.6 9.6 9.6 9.6 9.6 9.6 9.5 8.6
    赖氨酸 Lys 8.7 8.7 8.7 8.7 8.7 8.7 8.7 8.7 8.7 8.8 9.1
    蛋氨酸 Met 1.3 1.5 1.5 1.5 1.5 1.5 1.3 1.3 1.3 1.3 1.4
    苯丙氨酸 Phe 4.1 4.1 4.1 4.1 4.1 4.1 4.1 4.1 4.1 4.4 4.3
    脯氨酸 Pro 7.8 7.6 7.8 7.9 7.8 7.8 7.8 7.8 8.3 7.9 10.2
    丝氨酸 Ser 7.0 7.2 7.0 7.0 7.0 7.0 7.0 7.0 7.0 8.6 5.7
    苏氨酸 Thr 5.7 5.7 5.7 5.7 5.7 5.7 5.9 6.1 5.0 5.7 4.1
    色氨酸 Trp 0.2 0.2 0.2 0.2 0.2 0.2 0.2 0.2 0.2 0.2 0.2
    酪氨酸 Tyr 2.6 2.6 2.6 2.6 2.6 2.6 2.6 2.6 2.6 2.6 2.5
    缬氨酸 Val 4.4 4.1 4.1 4.1 4.1 4.1 4.4 4.4 4.1 4.2 3.4
    下载: 导出CSV 
    | 显示表格

    表6可知:牛科物种FEZF2的基本理化特征基本相似,都是亲水性蛋白质,但水牛属、牛属与羊属动物的属间有一定差异,主要表现在疏水性氨基酸与极性氨基酸的含量、不稳定指数和疏水性等方面。普通牛和瘤牛FEZF2的12G型和13G型除疏水性有一定差异外,其他指标较一致。牛科物种FEZF2的基本理化特征与人和家鼠的特别是与鸡的差异较大。

    表  6  牛科及非牛科物种FEZF2的基本理化特征
    Table  6.  Basic physicochemical characteristics of FEZF2 for species of Bovidae and non-Bovidae
    物种
    species
    Bubalus
    bubalis_
    13G
    Bos
    taurus_
    12G
    Bos
    taurus_
    13G
    Bos
    indicus_
    12G
    Bos
    indicus_
    13G
    Bos
    grunniens_
    13G
    Capra
    hircus_
    13G
    Ovis
    aries _
    13G
    Homo
    sapiens_
    16G
    Mus
    musculus_
    7G
    Gallus
    gallus _
    0G
    氨基酸数量
    number of AA
    459 458 459 458 459 459 459 459 459 455 441
    等电点
    isolectric point
    9.52 9.52 9.52 9.55 9.52 9.52 9.52 9.52 9.52 9.52 9.59
    分子量/ku
    molecular weight
    48.88 48.84 48.91 48.86 48.91 48.91 48.88 48.91 48.81 48.93 47.62
    强酸性氨基酸 (−)
    strongly acidic AAs
    26 26 26 26 26 26 26 26 26 26 27
    强碱性氨基酸 (+) strongly basic AAs 57 57 57 57 57 57 57 57 57 57 59
    疏水氨基酸
    hydrophobic AAs
    138 137 137 137 137 137 136 135 139 137 127
    极性氨基酸
    polar AAs
    124 125 124 124 124 124 125 126 121 131 106
    不稳定指数
    instability index
    43.74 44.09 44.28 42.64 44.28 44.28 43.32 42.90 44.90 44.10 43.60
    亲水性总平均值
    grand average of hydropathicity
    −0.324 −0.327 −0.329 −0.342 −0.329 −0.329 −0.334 −0.340 −0.328 −0.348 −0.473
    脂肪族指数
    aliphatic index
    68.1 67.62 67.47 67.62 67.47 67.47 67.67 67.45 67.91 67.21 64.26
    信号肽
    signal peptide
    N N N N N N N N N N N
    跨膜区
    transmembrane region
    N N N N N N N N N N N
    注:N. 无该结构。
    Note: N. without the structure.
    下载: 导出CSV 
    | 显示表格

    图3可知:除猪和鸡的FEZF2蛋白含有9个基序外,其他物种的FEZF2蛋白均含有10个基序。预测结果(表6)显示:牛科和非牛科动物的FEZF2蛋白都不含有跨膜结构和信号肽,但都含有1个COG5048保守结构域,由6个C2H2类型的锌指结构域组成(图3图4),由基序3、2、9和1构成。牛科与和非牛科动物的FEZF2的COG5048保守结构域所在位置一致,在靠近多肽链的C端一侧(牛科动物在多肽链的AA288~440之间)。人、家鼠和猪除含有1个COG5048保守结构域之外,在AA385~441之间还含有1个SFP1超家族结构域;家鼠在AA317~339之间还有1个zf-H2C2_2结构域。

    图  3  牛科和非牛科动物FEZF2的基序模式和保守域
    Figure  3.  Motif patterns and conserved domains of FEZF2 in species of Bovidae and non-Bovidae
    图  4  预测的牛科动物FEZF2蛋白三级结构
    注:a) 水牛_13G;b) 普通牛_12G;c)普通牛_13G;d)瘤牛_12G;e)瘤牛_13G;f) 牦牛_13G;g) 绵羊_13G;h) 山羊_13G。
    Figure  4.  Tertiary structure of FEZF2 protein predicted in Bovidae
    Note: a) Bubalus bubalis_13G; b) Bos taurus_12G; c) Bos taurus_13G; d) Bos indicus_12G; e) Bos indicus_13G; f) Bos grunniens_13G; g) Capra hircus_13G; h) Ovis aries_13G.

    表7可知:水牛属和牛属动物与羊属动物的FEZF2氨基酸序列中形成各类二级结构的氨基酸数量有一定差异,牛科与非牛科动物差异更大。同源建模显示:构建牛科物种FEZF2蛋白的最佳模型为鼠锌指蛋白568模板(5wjq.1.C)。水牛、普通牛(12/13G)、瘤牛(12/13G)、牦牛和山羊的FEZF2蛋白三维结构与模板一致性为43%,覆盖率为37% (AA275~445之间);绵羊13G的三级结构与5wjq.1.C的覆盖率为37%,一致性为41%,缺少1个锌指结构;预测的模板覆盖区域在COG5048保守结构域区,三维结构显示该区域含有6个典型的锌指结构(绵羊含5个),与结构域分析基本一致。从三维结构来看,牛科物种的属间有一定差异;水牛与普通牛、瘤牛的13G和12G型FEZF2都有差异,但与普通牛13G型差异相对较小(图4)。

    表  7  形成各物种FEZF2蛋白二级结构的氨基酸数量占比
    Table  7.  Proportion of amino acids that form the secondary structure of FEZF2 proteins in different species %
    物种
    species
    α螺旋
    alpha helix
    延伸片段
    extended strand
    β折叠
    beta turn
    无规则卷
    random coil
    Bubalus bubalis_13G 23.97 10.68 4.36 61.00
    Bos taurus_12G 23.58 10.48 5.24 60.70
    Bos taurus_13G 23.97 10.68 4.36 61.00
    Bos indicus_12G 23.58 12.66 5.24 58.52
    Bos indicus_13G 23.97 10.68 4.36 61.00
    Bos grunniens_13G 23.97 10.68 4.36 61.00
    Capra hircus_13G 23.09 11.55 4.79 60.57
    Ovis aries_13G 22.22 12.85 4.79 60.13
    Homo sapiens_16G 23.75 12.42 4.58 59.26
    Mus musculus_7G 23.74 12.53 4.40 59.34
    Gallus gallus_0G 24.26 13.15 4.76 57.82
    下载: 导出CSV 
    | 显示表格

    亚细胞定位分析表明:各物种FEZF2定位于细胞核内的支持分数值为10 (满分),表明FEZF2蛋白为在细胞核内发挥功能作用的蛋白质。生物信息分析表明:FEZF2蛋白主要参与轴突成束、细胞去分化、细胞群增殖的负调控、神经元分化的负调节、神经元命运的决定和神经元分化的正向调节等生物学过程。它能与染色质结合,具有DNA结合转录激活或抑制因子活性,能激活或抑制RNA聚合酶II转录的特定基因集转录;还具有能与蛋白编码基因顺式调控序列特异性结合的功能。

    图5可知:与各牛科物种的FEZF2蛋白相互作用的蛋白不完全相同,其中共有的互作蛋白主要为BCL11B、CUX1、CUX2、ETV1、FOXP2、KCNN2、NEUROG2、NR2E1、OTP、PAX6、SATB2、SLC38A11、SOX5、TBR1和ZFPM2等,主要为参与胸腺细胞发育过程中T淋巴细胞分化和存活的关键调节因子,参与控制大脑中神经元的增殖和分化的转录因子、转录激活或抑制因子,调节神经元的兴奋性钾离子通道,参与神经元分化的转录调节因子,参与调节视网膜发育核受体亚家族2组E成员,参与下丘脑神经内分泌细胞分化的骨同源盒蛋白,在眼睛、鼻子、中枢神经系统和胰腺的发育中起重要作用的转录因子,在核基质或支架相关区域与DNA结合的蛋白,参与软骨细胞分化和软骨形成转录因子,参与皮质发育(包括神经元迁移、板层和区域特征)以及轴突投射过程的转录抑制因子和具有锌指结构的转录调节因子等。

    图  5  牛科物种FEZF2蛋白质相互作用网络
    注:网络节点代表蛋白质。a)水牛;b)普通牛;c)瘤牛杂交牛;d)牦牛;e)山羊;f)绵羊。
    Figure  5.  Interaction network of FEZF2 protein in species of Bovidae
    Note: Network nodes indicate proteins. a) Bubalus bubalis; b) Bos taurus; c) Bos indicus hybrid; d) Bos grunniens; e) Capra hircus; f) Ovis aries.

    图6可知:各牛科物种FEZF2氨基酸序列的一致性在99.7%~100.0%之间;它们与非牛科哺乳动物FEZF2氨基酸序列的一致性在94.1%~99.3%之间;与鸡的序列一致性偏低,在78.9%~ 79.4%之间。各物种FEZF2氨基酸序列间的差异位点及其连续甘氨酸重复区的位置与差异见图7

    图  6  牛科与非牛科物种FEZF2氨基酸序列一致性与分歧度
    注:对角线上方数值表示序列一致性,对角线下方数值表示序列分歧度。
    Figure  6.  Identify and divergence of FEZF2 amino acid sequences between species of Bovidae and non-Bovidae
    Note: Data above the diagonal line indicate the identify, and below the diagonal line indicate the sequential divergence.
    图  7  牛科与非牛科物种FEZF2氨基酸序列差异
    注:图中阴影部分为连续的甘氨酸重复区。
    Figure  7.  Amino acid sequence differences of FEZF2 among the species of Bovidae and non-Bovidae
    Note: The shaded area is the continuous glycine repetition region.

    图8可知:在系统发育树上,普通牛、瘤牛、牦牛、中亚马鹿、水牛与山羊、绵羊等聚在一大支,支持率为99%;而人、马、驴、单峰驼、野骆驼、人、家鼠、猫和狮子聚在另一支。

    图  8  牛科和非牛科动物FEZF2的系统发育关系
    Figure  8.  Phylogenetic relationships of FEZF2 in species of Bovidae and non-Bovidae

    牛科家养动物是人类奶制品、肉类和畜力的重要来源,在畜牧业经济中占有十分重要的地位。近年研究表明:FEZF2参与动物的神经元发育,是与动物先天免疫和奶牛乳腺炎抗性紧密相关的重要候选基因[1-4,8],但目前对牛科物种FEZF2基因的研究主要针对普通奶牛,对其他牛科家养动物的涉及还十分有限[2-8]。阐明牛科物种FEZF2基因的分子特征、结构、功能及其与非牛科物种的差异,有助于深入理解FEZF2基因与动物神经发育和先天免疫的关联机制,也可为牛科家养动物奶用和肉用性状的抗病育种提供依据。为此,本研究从公共生物大分子数据库和基因组数据库下载了牛科家畜及用于比较的常见非牛科物种的FEZF2基因及其编码蛋白序列,采用生物信息学和比较基因组学方法进行深入的比较分析。结果表明:牛科物种FEZF2基因在CDS长度、碱基组成和CDS结构组成模式上具有较高的一致性;其编码产物的氨基酸组成、序列一致性、理化特征、基序、保守结构域和三维结构等虽具有一定的种属间差异,但一致性非常高,与非牛科动物的一致性也较高。系统发育分析也显示:牛科FEZF2蛋白序列聚集在一大支中,表明牛科家养动物的FEZF2蛋白有着较近的遗传关系。本研究表明:牛科FEZF2蛋白与非牛科哺乳动物具有相似功能,牛科家养动物间一致性更高。

    有研究发现:FEZF2蛋白是一种含有C2H2型锌指结构域和连续甘氨酸重复区的转录因子,它能控制单胺能神经元的发育[1,11-12]FEZF2缺陷的小鼠呈现出过度活跃的行为,揭示FEZF2基因在神经元发育中起作用[7]。SUGIMOTO等[2]报道FEZF2在普通牛大脑中强表达,在乳腺中弱表达。在泌乳期水牛中,FEZF2在大脑中的表达水平最高,在小脑、垂体、心、肺、脾和肾中有较高水平的表达,在乳腺、肌肉、小肠和十二指肠组织中有适量表达[6]。在奶牛中发现,乳腺炎能够诱导乳腺中FEZF2表达,进而上调细胞中SEMA5A表达,进一步引起与机体免疫反应相关的多个基因表达[2,8]。因此,FEZF2基因不仅与神经元发育相关,而且由于神经元发育和免疫之间存在串扰,导致其与先天免疫相关[2,8]。本研究显示:牛科动物FEZF2蛋白都是在核内发挥功能的亲水性蛋白,无信号肽序列及跨膜结构域,都含有1个COG5048保守的锌指结构域,其参与的生物学过程主要与神经元发育调节有关,分子功能主要与染色质结合、转录激活或抑制有关[12-13];与其相互作用的蛋白多为与神经元发育和先天免疫调节密切相关的转录因子或蛋白。结合其在序列和结构上的保守性,推测FEZF2蛋白参与牛科家养动物的神经元发育和与先天免疫相关的生物学过程。

    SUGIMOTO等[2,8]研究表明:FEZF2基因中连续甘氨酸重复区的多态性与奶牛乳腺炎抗性相关,但这种多态性对产奶量、乳中脂、蛋白和非脂肪固型物产量的估计育种值无不利影响。该区域13G型等位基因导致奶牛对乳腺炎易感,而12G型等位基因使奶牛对乳腺炎具有抗性,这是因为12G型抗性等位基因促进SEMA5A表达的能力显著强于易感的13G型等位基因,即12G型等位基因引起的免疫应答水平高于13G型的等位基因[2,8]。进一步研究发现:易感的13G型FEZF2含有的甘氨酸重复区能与胰岛素样生长因子1受体(IGF1R)基因5′UTR中较长的胞嘧啶(C)伸展相结合,通过促进IGF1R的表达而抑制乳腺上皮细胞的自噬过程,进而介导对乳腺炎的易感性[3]。携带13G型的FEZF2与5′UTR中含较长C延伸的IGF1R的变异组合的奶牛更容易患乳腺炎[3]。本研究通过序列比对发现:哺乳动物的FEZF2蛋白都存在连续甘氨酸重复区,但各物种间甘氨酸重复的数量有差异。在牛科家养动物中,普通牛和瘤牛的FEZF2在该区域都存在12G和13G型等位基因,而在水牛、牦牛、山羊和绵羊中,该区域只存在13G型等位基因。前期魏伟等[5]对河流型和沼泽型水牛群体检测发现:这两类水牛的FEZF2都为13G型。在水牛、牦牛、山羊和绵羊中,FEZF2蛋白只存在13G型,它是否会导致这些牛科物种乳腺炎易感或先天免疫应答受损有待进一步深入研究。值得注意的是,截至目前,未见沼泽型水牛、牦牛、山羊和绵羊患乳腺炎的报道;奶用河流型水牛乳腺炎的发病率仅约4%,显著低于普通奶牛[14-16]。本研究发现:在氨基酸序列一致性、理化特性和结构上,各牛科物种的FEZF2虽然具有较高的一致性,但仍存在一定的种属间差异,这些差异是否与水牛、牦牛、山羊和绵羊对乳腺炎的抗性有关尚不清楚,因此,有必要通过群体水平的试验观察和进一步的细胞水平功能试验予以证实。

    本研究通过序列比对,发现了一些具有种属特征的核苷酸或氨基酸差异位点,这些位点不仅反映了种属间FEZF2功能的差异,而且也可作为种属间相互区分的分子标记。

    牛科物种的FEZF2基因编码蛋白在氨基酸组成、序列一致性、理化特征和结构上虽然有种属间差异,但一致性较高。在牛科中,水牛、牦牛、绵羊和山羊FEZF2序列的连续甘氨酸重复区为13G型,而普通牛和瘤牛的同源区有12G和13G型。牛科动物FEZF2蛋白都是在核内发挥生物学功能的亲水性蛋白,都含有1个由6个锌指结构组成的COG5048保守结构域,参与的生物学过程主要与神经元发育调节有关,分子功能主要与染色质结合、转录激活或抑制有关。本研究揭示FEZF2蛋白可能参与了牛科物种神经元发育和机体免疫相关基因的表达调控过程。

  • 图  1   牛科物种FEZF2基因核苷酸序列差异

    注:物种中文名见表1;“数字+G”表示该物种FEZF2蛋白序列中的甘氨酸重复数;下同。阴影部分为连续的甘氨酸编码区。

    Figure  1.   Nucleotide sequence differences of FEZF2 gene in species of Bovidae

    Note: Chinese name of species list in Tab.1; “number+G” indicates the number of glycine repeats in the FEZF2 protein sequence of species; the same as below. The shaded area is the continuous glycine coding region.

    图  2   牛科物种及非牛科动物的FEZF2基因结构

    Figure  2.   Structure of FEZF2 gene in Bovidae and non-Bovidae

    图  3   牛科和非牛科动物FEZF2的基序模式和保守域

    Figure  3.   Motif patterns and conserved domains of FEZF2 in species of Bovidae and non-Bovidae

    图  4   预测的牛科动物FEZF2蛋白三级结构

    注:a) 水牛_13G;b) 普通牛_12G;c)普通牛_13G;d)瘤牛_12G;e)瘤牛_13G;f) 牦牛_13G;g) 绵羊_13G;h) 山羊_13G。

    Figure  4.   Tertiary structure of FEZF2 protein predicted in Bovidae

    Note: a) Bubalus bubalis_13G; b) Bos taurus_12G; c) Bos taurus_13G; d) Bos indicus_12G; e) Bos indicus_13G; f) Bos grunniens_13G; g) Capra hircus_13G; h) Ovis aries_13G.

    图  5   牛科物种FEZF2蛋白质相互作用网络

    注:网络节点代表蛋白质。a)水牛;b)普通牛;c)瘤牛杂交牛;d)牦牛;e)山羊;f)绵羊。

    Figure  5.   Interaction network of FEZF2 protein in species of Bovidae

    Note: Network nodes indicate proteins. a) Bubalus bubalis; b) Bos taurus; c) Bos indicus hybrid; d) Bos grunniens; e) Capra hircus; f) Ovis aries.

    图  6   牛科与非牛科物种FEZF2氨基酸序列一致性与分歧度

    注:对角线上方数值表示序列一致性,对角线下方数值表示序列分歧度。

    Figure  6.   Identify and divergence of FEZF2 amino acid sequences between species of Bovidae and non-Bovidae

    Note: Data above the diagonal line indicate the identify, and below the diagonal line indicate the sequential divergence.

    图  7   牛科与非牛科物种FEZF2氨基酸序列差异

    注:图中阴影部分为连续的甘氨酸重复区。

    Figure  7.   Amino acid sequence differences of FEZF2 among the species of Bovidae and non-Bovidae

    Note: The shaded area is the continuous glycine repetition region.

    图  8   牛科和非牛科动物FEZF2的系统发育关系

    Figure  8.   Phylogenetic relationships of FEZF2 in species of Bovidae and non-Bovidae

    表  1   FEZF2基因序列的来源

    Table  1   Sequence source of FEZF2 gene

    基因序列号
    accession number of gene sequences
    蛋白质序列号
    accession number of protein sequences
    物种
    species
    序列来源
    source of sequence
    XM_045163982.1 XP_045019917.1 水牛 Bubalus bubalis NCBI
    NM_001038198.2 NP_001033287.1 普通牛 Bos taurus NCBI
    ENSBTAG00000020302 ENSBTAP00000027056 普通牛 Bos taurus Ensembl
    XM_019984262.1 XP_019839821.1 瘤牛 Bos indicus NCBI
    JX312831.1 AFS31067.1 瘤牛 Bos indicus NCBI
    ENSBIXG00000029646 ENSBIXP00000000579 杂交牛 Bos taurus hybrid Ensembl
    ENSBIXG00005030934 ENSBIXP00005045927 杂交牛 Bos indicus hybrid Ensembl
    ENSBGRG00000026510 ENSBGRP00000042330 牦牛 Bos grunniens Ensembl
    XM_005696081.3 XP_005696138.2 山羊 Capra hircus NCBI
    XM_004018621.5 XP_004018670.3 绵羊 Ovis aries NCBI
    XM_010980957.2 XP_010979259.2 单峰驼 Camelus dromedarius NCBI
    XM_032458017.1 XP_032313908.1 野骆驼 Camelus ferus NCBI
    XM_014868769.2 XP_014724255.1 Equus asinus NCBI
    XM_023620158.1 XP_023475926.1 Equus caballus NCBI
    ENSCHYG00000014589 ENSCHYP00000021735 中亚马鹿 Cervus hanglu yarkandensis Ensembl
    XM_021069124.1 XP_020924783.1 Sus scrofa NCBI
    NM_018008.4 NP_060478.3 Homo sapiens NCBI
    NM_080433.3 NP_536681.2 家鼠 Mus musculus NCBI
    XM_023249900.2 XP_023105668.1 Felis catus NCBI
    XM_042927529.1 XP_042783463.1 狮子 Panthera leo NCBI
    XM_414411.6 XP_414411.2 Gallus gallus NCBI
    下载: 导出CSV

    表  2   FEZF2基因编码区碱基组成

    Table  2   Base composition in the coding region of FEZF2 gene

    物种 speciesAGTCA+TC+G
    Bubalus bubalis_13G 21.30 28.26 16.45 33.99 37.75 62.25
    Bos taurus_12G 21.42 28.03 16.63 33.91 38.05 61.95
    Bos taurus_13G 21.38 28.12 16.59 33.91 37.97 62.30
    Bos indicus_12G 21.57 27.96 16.49 33.99 38.05 61.95
    Bos indicus_13G 21.38 28.12 16.52 33.99 37.90 62.10
    Bos taurus hybrid_13G 21.38 28.12 16.59 33.91 37.97 62.03
    Bos indicus hybrid_13G 21.38 28.12 16.52 33.99 37.90 62.10
    Bos grunniens_13G 21.38 28.12 16.52 33.99 37.90 62.10
    Capra hircus_13G 21.59 28.19 16.30 33.91 37.90 62.10
    Ovis aries_13G 21.59 28.19 16.30 33.91 37.90 62.10
    Camelus dromedarius_22G 21.10 28.61 16.02 34.26 37.12 62.88
    Camelus ferus_24G 20.94 28.92 15.88 34.26 36.82 63.18
    Equus asinus_16G 20.72 28.84 15.29 35.14 36.01 63.99
    Equus caballus_19G 20.45 29.23 15.19 35.13 35.64 64.36
    Cervus hanglu yarkandensis_14G 21.26 28.63 16.05 34.06 37.31 62.69
    Sus scrofa_17G 21.35 28.32 16.49 33.84 37.84 62.16
    Homo sapiens_16G 21.16 28.41 15.72 34.71 36.88 63.12
    Mus musculus_7G 23.10 25.37 18.06 33.48 41.15 58.85
    Felis catus_21G 20.57 29.46 15.41 34.55 35.99 64.01
    Panthera leo_19G 20.81 29.16 15.48 34.56 36.29 63.71
    Gallus gallus_0G 20.36 30.24 13.65 35.75 34.01 65.99
    注:物种中文名见表1;“数字+G”表示该物种FEZF2蛋白序列中的甘氨酸重复数;下同。
    Note: Chinese name of species list in Tab.1; “number+G” indicates the number of glycine repeats in the FEZF2 amino acid sequence of species; the same as below.
    下载: 导出CSV

    表  3   牛科物种FEZF2基因核苷酸序列的一致性

    Table  3   Nucleotide sequence consistency of FEZF2 gene between the species of Bovidae and non-Bovidae %

    物种
    species
    Bubalus
    bubalis_
    13G
    Bos
    taurus_
    12G
    Bos
    taurus_
    13G
    Bos
    indicus_
    12G
    Bos
    indicus_
    13G
    Bos
    taurus hybrid_
    13G
    Bos
    indicus hybrid_
    13G
    Bos
    grunniens_
    13G
    Capra
    hircus_
    13G
    Ovis
    aries_
    13G
    Bubalus bubalis_13G *** 99.0 99.7 99.7 99.7 99.0 99.7 99.7 98.7 98.7
    Bos taurus_12G 0.8 *** 99.3 99.3 99.4 99.8 99.3 99.3 97.9 97.9
    Bos taurus_13G 0.3 0.5 *** 100.0 99.9 99.2 100.0 100.0 98.6 98.6
    Bos indicus_12G 0.3 0.5 0.0 *** 99.9 99.2 100.0 100.0 98.6 98.6
    Bos indicus_13G 0.4 0.4 0.1 0.1 *** 99.2 99.9 99.9 98.5 98.5
    Bos taurus hybrid_13G 0.9 0.2 0.6 0.6 0.7 *** 99.2 99.2 97.8 97.8
    Bos indicus hybrid_13G 0.3 0.5 0.0 0.0 0.1 0.6 *** 100.0 98.6 98.6
    Bos grunniens_13G 0.3 0.5 0.0 0.0 0.1 0.6 0.0 *** 98.6 98.6
    Capra hircus_13G 1.4 2.0 1.5 1.5 1.5 2.1 1.5 1.5 *** 99.9
    Ovis aries_13G 1.4 2.0 1.5 1.5 1.5 2.1 1.5 1.5 0.1 ***
    注:对角线以上数值表示序列一致性,对角线以下数值代表序列分歧度。
    Note: The values above diagonal line indicate the identity, the values below the diagonal indicate divergence.
    下载: 导出CSV

    表  4   牛科和非牛科动物FEZF2基因结构的比较

    Table  4   Comparison of FEZF2 gene structure between species of Bovidae and non-Bovidae

    物种
    species
    染色体位置
    chromosome
    location
    外显子数
    number of
    exon
    内含子数
    number of
    intron
    长度/bp length
    5′UTRE1E2E3E4E5E6E7E8E93′UTRCDS
    Bubalus bubalis_13G NC_059177.1 9 8 1233 1175 910 135 133 3318 79 64 160 309 3673 1380
    Bos taurus_12G NC_037349.1 6 5 219 27 134 907 135 133 681 424 1377
    Bos taurus_13G Ensembl 6 5 219 27 134 910 135 133 679 419 1380
    Bos indicus_12G NC_032671.1 5 4 295 237 907 135 133 687 430 1377
    Bos indicus_13G NC_032671.1 6 5 219 27 134 910 135 133 687 427 1380
    Bos taurus
    hybrid_13G
    Ensembl 6 5 921 729 134 910 135 133 715 455 1380
    Bos indicus
    hybrid_13G
    Ensembl 6 5 815 623 134 910 135 133 715 455 1380
    Bos grunniens_13G Ensembl 6 5 358 166 134 910 135 133 719 459 1380
    Capra hircus_13G NC_030829.1 5 4 295 237 910 135 133 688 431 1380
    Ovis aries_13G NC_056072.1 5 4 1329 1271 910 135 133 702 455 1380
    Camelus dromedarius_22G NC_044527.1 5 4 234 176 928 135 133 654 397 1398
    Camelus ferus_24G NC_045712.1 4 3 21 897 135 133 390 133 1404
    Equus asinus_16G NW_014638425.1 5 4 282 224 910 135 133 669 413 1380
    Equus caballus_19G NC_009159.3 4 3 83 944 135 133 651 394 1389
    Cervus hanglu
    yarkandensis_14G
    Ensembl 6 5 281 89 134 913 135 133 718 458 1383
    Sus scrofa_17G NC_010455.5 5 4 1276 1218 907 135 133 327 70 1377
    Homo sapiens_16G NC_000003.12 5 4 330 272 910 135 133 662 405 1380
    Mus musculus_7G NC_000080.6 5 4 332 279 890 135 133 867 607 1368
    Felis catus_21G NC_018724.3 6 5 841 778 528 402 135 133 672 415 1395
    Panthera leo_19G NC_056680.1 4 3 861 135 133 348 91 1389
    Gallus gallus_0G NC_045712.1 4 3 21 856 135 133 534 133 1326
    注:E1~E9分别代表外显子1~9。
    Note: E1-E9 indicate exons 1-9, respectively.
    下载: 导出CSV

    表  5   牛科物种与非牛科动物FEZF2氨基酸组成

    Table  5   Amino acid composition of FEZF2 in species of Bovidae and non-Bovidae %

    氨基酸
    amino acid
    Bubalus
    bubalis_
    13G
    Bos
    taurus_
    12G
    Bos
    taurus_
    13G
    Bos
    indicus_
    12G
    Bos
    indicus _
    13G
    Bos
    grunniens_
    13G
    Capra
    hircus_
    13G
    Ovis
    aries _
    13G
    Homo
    sapiens_
    16G
    Mus
    musculus _
    7G
    Gallus
    gallus_
    0G
    丙氨酸 Ala 9.6 9.6 9.6 9.6 9.6 9.6 9.2 8.9 10 9.7 9.3
    精氨酸 Arg 3.7 3.7 3.7 3.7 3.7 3.7 3.7 3.7 3.7 3.7 4.3
    天冬酰胺 Asn 4.1 4.1 4.1 4.4 4.1 4.1 4.1 4.1 4.1 4.2 3.9
    天冬氨酸 Asp 1.7 1.7 1.7 1.7 1.7 1.7 2 2 1.7 1.8 1.8
    半胱氨酸 Cys 4.8 4.8 4.8 4.6 4.8 4.8 4.8 4.8 4.8 4.8 4.8
    谷氨酰胺 Gln 2.8 2.8 2.8 2.8 2.8 2.8 2.8 2.8 2.8 2.9 3.2
    谷氨酸 Glu 3.9 3.9 3.9 3.9 3.9 3.9 3.7 3.7 3.9 4.0 4.3
    甘氨酸 Gly 10.9 10.7 10.9 10.7 10.9 10.9 11.1 11.1 10.9 8.6 10.2
    组氨酸 His 4.8 4.8 4.8 4.8 4.8 4.8 4.8 4.8 4.8 5.1 5.9
    异亮氨酸 Ile 2.2 2.2 2.2 2.2 2.2 2.2 2.2 2.2 2.2 2.2 2.9
    亮氨酸 Leu 9.6 9.6 9.6 9.6 9.6 9.6 9.6 9.6 9.6 9.5 8.6
    赖氨酸 Lys 8.7 8.7 8.7 8.7 8.7 8.7 8.7 8.7 8.7 8.8 9.1
    蛋氨酸 Met 1.3 1.5 1.5 1.5 1.5 1.5 1.3 1.3 1.3 1.3 1.4
    苯丙氨酸 Phe 4.1 4.1 4.1 4.1 4.1 4.1 4.1 4.1 4.1 4.4 4.3
    脯氨酸 Pro 7.8 7.6 7.8 7.9 7.8 7.8 7.8 7.8 8.3 7.9 10.2
    丝氨酸 Ser 7.0 7.2 7.0 7.0 7.0 7.0 7.0 7.0 7.0 8.6 5.7
    苏氨酸 Thr 5.7 5.7 5.7 5.7 5.7 5.7 5.9 6.1 5.0 5.7 4.1
    色氨酸 Trp 0.2 0.2 0.2 0.2 0.2 0.2 0.2 0.2 0.2 0.2 0.2
    酪氨酸 Tyr 2.6 2.6 2.6 2.6 2.6 2.6 2.6 2.6 2.6 2.6 2.5
    缬氨酸 Val 4.4 4.1 4.1 4.1 4.1 4.1 4.4 4.4 4.1 4.2 3.4
    下载: 导出CSV

    表  6   牛科及非牛科物种FEZF2的基本理化特征

    Table  6   Basic physicochemical characteristics of FEZF2 for species of Bovidae and non-Bovidae

    物种
    species
    Bubalus
    bubalis_
    13G
    Bos
    taurus_
    12G
    Bos
    taurus_
    13G
    Bos
    indicus_
    12G
    Bos
    indicus_
    13G
    Bos
    grunniens_
    13G
    Capra
    hircus_
    13G
    Ovis
    aries _
    13G
    Homo
    sapiens_
    16G
    Mus
    musculus_
    7G
    Gallus
    gallus _
    0G
    氨基酸数量
    number of AA
    459 458 459 458 459 459 459 459 459 455 441
    等电点
    isolectric point
    9.52 9.52 9.52 9.55 9.52 9.52 9.52 9.52 9.52 9.52 9.59
    分子量/ku
    molecular weight
    48.88 48.84 48.91 48.86 48.91 48.91 48.88 48.91 48.81 48.93 47.62
    强酸性氨基酸 (−)
    strongly acidic AAs
    26 26 26 26 26 26 26 26 26 26 27
    强碱性氨基酸 (+) strongly basic AAs 57 57 57 57 57 57 57 57 57 57 59
    疏水氨基酸
    hydrophobic AAs
    138 137 137 137 137 137 136 135 139 137 127
    极性氨基酸
    polar AAs
    124 125 124 124 124 124 125 126 121 131 106
    不稳定指数
    instability index
    43.74 44.09 44.28 42.64 44.28 44.28 43.32 42.90 44.90 44.10 43.60
    亲水性总平均值
    grand average of hydropathicity
    −0.324 −0.327 −0.329 −0.342 −0.329 −0.329 −0.334 −0.340 −0.328 −0.348 −0.473
    脂肪族指数
    aliphatic index
    68.1 67.62 67.47 67.62 67.47 67.47 67.67 67.45 67.91 67.21 64.26
    信号肽
    signal peptide
    N N N N N N N N N N N
    跨膜区
    transmembrane region
    N N N N N N N N N N N
    注:N. 无该结构。
    Note: N. without the structure.
    下载: 导出CSV

    表  7   形成各物种FEZF2蛋白二级结构的氨基酸数量占比

    Table  7   Proportion of amino acids that form the secondary structure of FEZF2 proteins in different species %

    物种
    species
    α螺旋
    alpha helix
    延伸片段
    extended strand
    β折叠
    beta turn
    无规则卷
    random coil
    Bubalus bubalis_13G 23.97 10.68 4.36 61.00
    Bos taurus_12G 23.58 10.48 5.24 60.70
    Bos taurus_13G 23.97 10.68 4.36 61.00
    Bos indicus_12G 23.58 12.66 5.24 58.52
    Bos indicus_13G 23.97 10.68 4.36 61.00
    Bos grunniens_13G 23.97 10.68 4.36 61.00
    Capra hircus_13G 23.09 11.55 4.79 60.57
    Ovis aries_13G 22.22 12.85 4.79 60.13
    Homo sapiens_16G 23.75 12.42 4.58 59.26
    Mus musculus_7G 23.74 12.53 4.40 59.34
    Gallus gallus_0G 24.26 13.15 4.76 57.82
    下载: 导出CSV
  • [1]

    MATSUO-TAKASAKI M, LIM J H, BEANAN M J, et al. Cloning and expression of a novel zinc finger gene, Fez, transcribed in the forebrain of Xenopus and mouse embryos[J]. Mechanisms of Development, 2000, 93(1/2): 201. DOI: 10.1016/s0925-4773(00)00264-1.

    [2]

    SUGIMOTO M, FUJIKAWA A, WOMACK J E, et al. Evidence that bovine forebrain embryonic zinc finger-like gene influences immune response associated with mastitis resistance[J]. Proceedings of the National Academy of Sciences, 2006, 103(17): 6454. DOI: 10.1073/pnas.0601015103.

    [3]

    SUGIMOTO M, SUGIMOTO Y. Variant in the 5′ untranslated region of insulin-like growth factor 1 receptor is associated with susceptibility to mastitis in cattle[J]. Genetics, 2012, 2(9): 1077. DOI: 10.1534/g3.112.003095.

    [4] 魏伟, 苗永旺. 奶牛乳腺炎抗性候选基因多态性研究进展[J]. 中国牛业科学, 2011, 37(6): 49. DOI: 10.3969/j.issn.1001-9111.2011.06.017.
    [5] 魏伟, 苗永旺, 李卫真, 等. 水牛前脑锌指蛋白(FEZL)基因外显子1多态性研究[J]. 家畜生态学报, 2011, 32(6): 21. DOI: 10.3969/j.issn.1673-1182.2011.06.005.
    [6] 张广乐, 吉丽, 王昌全, 等. 槟榔江水牛FEZL基因分离鉴定、分子特征及泌乳期多组织差异表达分析[J]. 家畜生态学报, 2020, 41(12): 13. DOI: 10.3969/j.issn.1673-1182.2020.12.003.
    [7]

    HIRATA T. Zinc finger gene fez-like functions in the formation of subplate neurons and thalamocortical axons[J]. Developmental Dynamics, 2004, 230(3): 546. DOI: 10.1002/dvdy.20068.

    [8]

    SUGIMOTO M, ITOH T, GOTOH Y, et al. Short communication: enhanced clinical mastitis resistance in holsteins with a FEZF2 p. Gly105 (12_13) polymorphism[J]. Journal of Dairy Science, 2011, 94(4): 2103. DOI: 10.3168/jds.2010-3362.

    [9]

    KUMAR S, STECHER G, TAMURA K. MEGA7: molecular evolutionary genetics analysis version 7.0 for bigger datasets[J]. Molecular Biology and Evolution, 2016, 33(7): 1870. DOI: 10.1093/molbev/msw054.

    [10]

    CHEN C J, CHEN H, ZHANG Y, et al. TBtools: an integrative toolkit developed for interactive analyses of big biological data[J]. Molecular Plant, 2020, 13(8): 1194. DOI: 10.1016/j.molp.2020.06.009.

    [11]

    LEVKOWITZ G, ZELLER J, SIROTKIN H I, et al. Zinc finger protein too few controls the development of monoaminergic neurons[J]. Nature Neuroscience, 2003, 6(1): 28. DOI: 10.1038/nn979.

    [12]

    TSYPORIN J, TASTAD D, MA X K, et al. Transcriptional repression by FEZF2 restricts alternative identities of cortical projection neurons[J]. Cell Reports, 2021, 35(12): 109269. DOI: 10.1016/j.celrep.2021.109269.

    [13]

    HOBERT O, KRATSIOS P. Neuronal identity control by terminal selectors in worms, flies, and chordates[J]. Current Opinion in Neurobiology, 2019, 56: 97. DOI: 10.1016/j.conb.2018.12.006.

    [14]

    KAVITHA K L, RAJESH K, SURESH K, et a1. Buffalo mastitis-risk factors[J]. Buffalo Bulletin, 2009, 28(3): 135. DOI: 10.1016/j.applanim.2009.07.007.

    [15]

    FAGIOLO A, LAI O. Mastitis in buffalo[J]. Italian Journal of Animal Science, 2010, 6(2): 200. DOI: 10.4081/ijas.2007.s2.200.

    [16]

    BEHESHTI R, ESHRATKHAH B, SHAYEGH J, et al. Prevalence and etiology of subclinical mastitis in Buffalo of the Tabriz region, Iran[J]. Journal of American Science, 2011, 7(5): 642.

  • 期刊类型引用(1)

    1. 李亚芬,刀文彬,范新阳,苗永旺. 鸡Ⅱ型角蛋白基因家族成员鉴定及其功能的生物信息学分析. 云南农业大学学报(自然科学). 2024(06): 34-47 . 百度学术

    其他类型引用(0)

图(8)  /  表(7)
计量
  • 文章访问数:  2507
  • PDF下载量:  39
  • 被引次数: 1
出版历程
  • 通信作者:  苗永旺 yongwangmiao1@126.com
  • 收稿日期:  2022-03-06
  • 修回日期:  2022-05-25
  • 网络首发日期:  2022-07-29

目录

/

返回文章
返回