牛科物种THRSP基因的分子特征及功能比较分析
探究牛科物种THRSP基因的序列特征、功能差异及系统发育关系。
从NCBI和Ensembl数据库下载常见牛科物种和非牛科物种的THRSP基因及其编码产物的氨基酸序列,进一步利用比较基因组学和生物信息学方法对所得数据进行比较分析。
牛科物种THRSP基因转录区的结构相似,编码序列一致性高(93.2%~96.9%),但非翻译区和内含子差异较大。牛科THRSP蛋白均为亲水性核蛋白,无跨膜区和信号肽,都包含1个Spot_14或Spot_14超家族保守结构域,其参与的生物学路径主要与脂类的生物合成有关,分子功能主要与脂肪酸合酶活性和蛋白同源二聚化活性相关。与牛科THRSP互作的蛋白质主要与脂肪酸的合成和β-氧化、蛋白质代谢和转运、跨细胞膜或细胞器的物质转运、溶酶体与吞噬体的融合等生物学过程有关。牛科THRSP蛋白的氨基酸组成、理化特性、基序组成模式、保守结构域、功能修饰位点和高级结构高度相似,但表现出属间差异。系统发育分析表明:牛科物种同属动物间THRSP蛋白的亲缘关系更近。
牛科物种THRSP序列和结构一致性高、功能相似,是一种在细胞核中发挥功能作用的亲水蛋白,推测其参与牛科物种脂合成的调节。
Comparison Analysis of Molecular Characteristics and Functions of THRSP Gene in Bovidae
To explore the sequence characteristics, functional differences and phylogenetic relationships of THRSP gene in Bovidae species.
The sequences of THRSP gene and its encoded product in common species of Bovidae and in some species of non-Bovidae were downloaded from NCBI and Ensembl databases, and the obtained sequences were further compared and analyzed by the methods of comparative genomics and bioinformatics.
The structure of transcription region of THRSP gene was similar, with high consistency (93.2%-96.9%) of coding sequence, but the length of untranslated region and intron were different greatly. The THRSP proteins of Bovidae were all hydrophilic nucleoproteins without transmembrane region and signal peptide, and they all contained a Spot_14 or a Spot_14 superfamily conserved domain. The biological pathway of THRSP protein involved was mainly related to lipid biosynthesis, and the molecular function of this protein was mainly related to fatty acid synthase activity and protein homodimerization activity. Proteins interacted with THRSP of Bovidae were mainly involved in biological processes such as fatty acid synthesis and β-oxidation, protein metabolism and transport, material transport across cell membranes or organelles, lysosome and phagosome fusion. The amino acid composition, physicochemical properties, motif composition pattern, conserved domain, functional modification site and advanced structures of THRSP protein were highly similar among the species of Bovidae, but displayed inter-generic differences. Phylogenetic analysis showed that THRSP proteins were more closely related among species of Bovidae.
The sequences and structures of THRSP are highly consistent in Bovidae, and its function is also similar. THRSP may play a functional role as a hydrophilic protein in the nucleus and may be involved in the regulation of lipid synthesis in Bovidae.
-
Keywords:
- species of Bovidae /
- THRSP gene /
- molecular characteristics /
- functions /
- biological pathways
-
甲状腺激素应答(thyroid hormone responsive,THRSP)基因的编码蛋白Spot14 (又称S14)最初由SEELIG等[1]鉴定自大鼠肝脏的体外翻译产物,是Spot14家族的重要成员之一。在该家族中,还有1个与其序列高度同源的蛋白——Spot14相关蛋白(Spot14-R,MIG12)[2]。Spot14家族成员包含3个保守区域,即N末端的疏水区、中间的疏水区和C末端的亮氨酸拉链区[2-4]。Spot14和Spot14-R依赖亮氨酸拉链结构形成同二聚体(Spot14/Spot14和Spot14-R/Spot14-R)或异二聚体(Spot14/Spot14-R)参与基因的表达调控[4-6]。目前NCBI数据库中已有普通牛、水牛、瘤牛、野牛、绵羊、山羊等主要牛科动物及单峰驼、双峰驼、马、驴、人、小鼠、鸡等非牛科动物的THRSP基因序列信息,有研究表明该基因参与奶牛和山羊的乳脂合成过程,并与奶牛乳脂率和乳品质有关[7-10]。
虽然已有一些关于牛科物种THRSP基因的研究,但对于牛科家畜THRSP分子特征及功能的深入比较分析鲜有报道。本研究从NCBI和Ensembl数据库下载了主要牛科物种和非牛科物种THRSP基因及对应的编码氨基酸序列,进一步采用比较基因组学和生物信息学分析方法对牛科物种该基因转录区的结构、编码区(coding sequence,CDS)的核苷酸组成、密码子使用偏好性 (codon usage bias,CUB)、编码产物的氨基酸组成、理化特性、结构特征、功能修饰位点、参与的生物学路径、分子功能和系统发育关系进行全面预测和分析,旨在阐明牛科物种THRSP基因的分子特征及功能差异,为其表达调控研究提供参考。
1. 材料与方法
1.1 序列及基因组注释文件的下载
从NCBI (https://www.ncbi.nlm.nih.gov/)和Ensembl (https://asia.ensembl.org/index.html)数据库中下载普通牛、水牛、牦牛、杂交牛、绵羊、山羊等牛科物种的THRSP基因及对应的编码氨基酸序列;利用NCBI网站中的在线Blast程序(https://blast.ncbi.nlm.nih.gov/Blast.cgi)进行同源搜索,获取与牛科THRSP同源的非牛科物种序列;从NCBI网站的Genome数据库(https://www.ncbi.nlm.nih.gov/genome/?term=)中下载各物种的基因组GTF格式数据用于分析。对所有序列进行比对和核对,筛除不完整或可能存在错误的序列,进一步对剩余的可靠序列(表1)进行分析。
表 1 本研究所用序列Table 1. Sequences used in this study物种
species基因序列号
accession numbers of gene蛋白质序列号
accession numbers of protein编码区长度/bp
length of coding sequences水牛 Bubalus bubalis XM_006077389.3 XP_006077451.1 471 普通牛 Bos taurus NM_001040533.1 NP_001035623.1 453 杂交牛 Bos indicus×Bos taurus XM_027531692.1 XP_027387493.1 471 牦牛 Bos mutus XM_005908067.2 XP_005908129.1 471 绵羊 Ovis aries XM_004019431.5 XP_004019480.1 471 山羊 Capra hircus XM_005699494.3 XP_005699551.2 471 弯角剑羚 Oryx dammah XM_040255623.1 XP_040111557.1 453 四川羚羊 Budorcas taxicolor XM_052662536.1 XP_052518496.1 471 单峰驼 Camelus dromedarius XM_010990079.2 XP_010988381.1 471 单峰驼 Camelus dromedarius XM_010990085.2 XP_010988387.1 471 双峰驼 Camelus bactrianus XM_010973453.2 XP_010971755.1 471 双峰驼 Camelus bactrianus XM_010973454.2 XP_010971756.1 471 野骆驼 Camelus ferus XM_006191650.3 XP_006191712.1 471 野骆驼 Camelus ferus XM_014565117.2 XP_014420603.1 471 欧洲马鹿 Cervus elaphus XM_043875526.1 XP_043731461.1 471 布哈拉马鹿 Cervus hangul bactrianus ENSCHYT00000006752.1 NSCHYP00000006052 444 马 Equus caballus XM_005612013.3 XP_005612070.1 453 马 Equus caballus XM_023645649.1 XP_023501417.1 453 驴 Equus asinus XM_014859662.2 XP_014715148.1 453 驴 Equus asinus XM_044751944.1 XP_044607879.1 453 野猪 Sus scrofa NM_001244376.1 NP_001231305.1 471 家猫 Felis catus XM_003992699.6 XP_003992748.1 453 人 Homo sapiens NM_003251.4 NP_003242.1 441 小鼠 Mus musculus NM_009381.3 NP_033407.1 453 原麝 Moschus moschiferus ENSMMST00000007051.1 ENSMMSP00000006409 444 鸡 Gallus gallus NM_213577.3 NP_998742.2 390 1.2 核苷酸组成和转录区结构分析
使用NCBI数据库中的ORF Finder程序(https://www.ncbi.nlm.nih.gov/orffinder/)查找已下载的各物种THRSP基因开放阅读框(open reading frame,ORF),以确定每条序列的完整CDS,使用Lasergene软件包(DNAStar Inc.,USA)中的EditSeq程序分析各物种THRSP基因CDS的碱基组成。在NCBI数据库中下载牛科和非牛科物种的基因组数据,并提取THRSP基因的转录本信息;使用TBtools[11]软件对各物种THRSP基因的转录本信息进行完整化处理,进一步使用在线软件Gene Structure Display Server 2.0 (http://gsds.gao-lab.org/)呈现各物种THRSP基因的转录区结构,包括非翻译区(untranslated region,UTR)、外显子和内含子。
1.3 THRSP基因的 CUB 分析
使用Codon程序(http://codonw.sourceforge.net/)进行各物种THRSP基因的 CUB 分析,包括相对同义密码子使用度(relative synonymous codon usage,RSCU)、有效密码子数 (effective number of codons,ENc值)、GC含量和密码子第3位的GC含量(GC of silent 3rd codon position,GC3s),其中,GC3s为除了蛋氨酸、色氨酸和终止密码子外,G和C出现在密码子第3个位置的频率。
1.4 编码蛋白的理化特性和结构特征分析
利用1.1节的编码氨基酸序列,使用在线程序ProtParam (http://web.expasy.org/protparam/)预测不同物种THRSP蛋白的分子质量和理论等电点;使用SignalP5.0 (https://services.healthtech.dtu.dk/service.php?SignalP-5.0)预测信号肽;使用TMHMM version 2.0 (http://www.cbs.dtu.dk/services/TMHMM/)预测跨膜结构域;使用ProtScale (http://web.expasy.org/ protscale/)预测疏水性;使用PROSITE (https://prosite.expasy.org/prosite.html)预测功能修饰位点;使用ProtComp 9.0 (http://linux1.softberry.com/berry.phtml)分析各物种THRSP蛋白的亚细胞定位;分别使用SOPMA (https://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl?page=/NPSA/npsa_sopma.html)和SWISS-MODEL (https://beta.swissmodel.expasy.org/)分析牛科物种THRSP蛋白的二级结构和三维结构,蛋白三维结构基于同源建模法,以小鼠Spot 14蛋白模板(3ont.1.A)为最佳模型构建;使用STRING (https://cn.string-db.org/)分析蛋白相互作用关系;使用NCBI Batch Web CD-Serach Tool (https://www.ncbi.nlm/cdd/)预测各物种THRSP的保守结构域;使用在线软件Meme Suite[12] (https://meme-suite.org)分析各物种THRSP保守基序;使用TBtools[11]软件的Gene Structure View (Advance)工具整合上述分析结果。
1.5 序列一致性和系统发育分析
使用Lasergene软件包(DNAStar Inc.,USA)中的MegAlign程序分析各物种THRSP基因CDS及编码氨基酸的序列一致性;使用MEGA 7[13]软件输出序列间的差异位点,进一步选用该软件中的最大似然法,基于优化出的T92+G和GTT+G+F模型分别构建核苷酸序列和氨基酸序列的系统发育树,每个节点处的支持率采用Bootstrap方法进行评估(10000次重复)。
2. 结果与分析
2.1 THRSP基因的核苷酸组成、转录区结构及CUB分析
2.1.1 CDS核苷酸组成和转录区结构
牛科与非牛科哺乳动物间THRSP基因CDS的核苷酸组成相似,但与非哺乳动物鸡的THRSP基因CDS核苷酸组成差异较大,且表现出属内相似性较高的特点;牛科动物中牛属和羊属动物的属内核苷酸组成相似性更高,水牛与牛属和羊属动物之间存在较大差异(表2)。不同物种THRSP基因的转录区结构存在差异,尤其是内含子长度和UTR长度的差异;除了骆驼科和马科物种包含2个可变剪接转录本外,其他物种都只包含1个可变剪接转录本;驴THRSP基因包含3个外显子和2个内含子,只有外显子2编码蛋白质,而其他物种的THRSP基因都由2个外显子和1个内含子组成,且只有外显子1编码蛋白质(图1)。
表 2 THRSP基因CDS核苷酸组成Table 2. Nnucleotide composition of THRSP CDS% 物种及其基因序列号
species and number of gene sequencesA T G C A+T G+C Bubalus bubalis_XM_006077389.3 24.63 17.41 31.63 26.33 42.04 57.96 Bos taurus_NM_001040533.1 23.40 16.56 32.67 27.37 39.96 60.04 Bos indicus×Bos taurus_XM_027531692.1 24.42 16.56 32.06 26.96 40.98 59.02 Bos mutus_XM_005908067.2 23.99 16.56 32.27 27.18 40.55 59.45 Ovis aries_XM_004019431.5 24.84 16.77 31.21 27.18 41.61 58.39 Capra hircus_XM_005699494.3 24.84 16.99 31.21 26.96 41.83 58.17 Oryx dammah_XM_040255623.1 23.18 16.11 32.45 28.26 39.29 60.71 Budorcas taxicolor_XM_052662536.1 24.42 16.56 31.42 27.60 40.98 59.02 Camelus dromedarius_XM_010990079.2_X1 23.78 16.99 32.27 26.96 40.76 59.24 Camelus dromedarius_XM_010990085.2_X2 23.78 16.99 32.27 26.96 40.76 59.24 Camelus bactrianus_XM_010973453.2_X1 23.78 16.99 32.27 26.96 40.76 59.24 Camelus bactrianus_XM_010973454.2_X2 23.78 16.99 32.27 26.96 40.76 59.24 Camelus ferus_XM_006191650.3_X1 23.78 17.41 32.27 26.54 41.19 58.81 Camelus ferus_XM_014565117.2_X2 23.78 17.41 32.27 26.54 41.19 58.81 Cervus elaphus_XM_043875526.1 23.57 14.44 33.12 28.87 38.00 62.00 Cervus hangul bactrianus_ENSCHYT00000006752.1 23.42 14.64 33.33 28.60 38.06 61.94 Equus asinus_XM_014859662.2_X1 23.40 16.56 32.01 28.04 39.96 60.04 Equus asinus_XM_044751944.1_X2 23.40 16.56 32.01 28.04 39.96 60.04 Equus caballus_XM_005612013.3_X1 23.40 16.56 32.01 28.04 39.96 60.04 Equus caballus_XM_023645649.1_X2 23.40 16.56 32.01 28.04 39.96 60.04 Sus scrofa_NM_001244376.1 23.57 17.62 31.63 27.18 41.19 58.81 Homo sapiens_NM_003251.4 25.27 16.77 31.00 26.96 42.04 57.96 Mus musculus_NM_009381.3 24.26 16.10 31.97 27.66 40.36 59.64 Felis catus_XM_003992699.6 25.17 16.78 31.57 26.49 41.94 58.06 Moschus moschiferus_ENSMMST00000007051.1 23.42 16.89 32.88 26.80 40.32 59.68 Gallus gallus_NM_213577.3 23.33 14.36 29.49 32.82 37.69 62.31 注:物种及其基因序列号对应的物种中文名见表1;下同。
Note: The Chinese names of species and accession number of gene sequences are shown in Tab.1; the same as below.图 1 牛科物种及非牛科物种THRSP转录区的结构注:物种及其基因序列号对应的物种中文名见表1。Figure 1. Structure of THRSP gene in the species of Bovidae and non-BovidaeNote: The Chinese names of species and accession number of gene sequences are shown in Tab.1.2.1.2 THRSP基因CDS的CUB分析
由表3可知:水牛THRSP基因对20种密码子具有偏好性(RSCU>1),普通牛THRSP基因RSCU>1的密码子有22种,杂交牛有18种,牦牛有20种,绵羊和山羊分别有22和21种,人和鸡都有23种,小鼠有24种。水牛与其他牛科物种共同偏好使用的密码子有20种,且对CUG、AGC、CCC、CGG、ACC、GUG、AUC等密码子的偏好性较强,水牛与其他牛科物种的RSCU值差异较大。牛科物种编码蛋氨酸和色氨酸的密码子RSCU值都为1。由表4可知:THRSP基因ENc值呈现属内相似、属间差异大的特点,且ENc值总体偏小,范围在33.95~44.22。牛科物种THRSP基因ENc值接近20,与其他非牛科动物存在较大差异,表明THRSP基因在牛科物种中的CUB较强;THRSP基因GC3s值范围为0.741~0.832,均大于0.5,说明THRSP基因中的密码子比较偏好以G/C结尾;GC含量范围为0.581~0.625,表明各物种THRSP基因CDS序列中G+C碱基的含量大于A+T碱基的含量。
表 3 牛科及非牛科物种THRSP基因密码子的RSCU值Table 3. RSCU values of THRSP gene codons in Bovidae and non-Bovidae氨基酸
amino acid密码子
codon水牛
Bubalus bubalis普通牛
Bos taurus杂交牛
Bos indicus×Bos taurus牦牛
Bos mutus绵羊
Ovis aries山羊
Capra hircus人类
Homo spaiens小鼠
Mus musculus亮氨酸
leucineUUA 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 UUG 0.63 0.32 0.32 0.32 0.63 0.63 0.00 0.00 CUU 0.95 0.95 0.95 0.95 0.95 0.95 0.38 0.71 CUC 0.95 0.95 0.95 0.95 0.95 0.95 1.88 1.06 CUA 0.00 0.00 0.00 0.00 0.00 0.00 0.38 0.71 CUG 3.47 3.79 3.79 3.79 3.47 3.47 3.38 3.53 丝氨酸
serineUCU 0.86 0.00 0.00 0.00 0.00 0.00 0.00 0.00 UCC 0.00 1.20 1.20 1.20 1.20 1.20 0.86 0.75 UCA 0.00 0.00 0.00 0.00 0.00 0.00 0.86 0.00 UCG 0.00 0.00 0.00 0.00 0.00 0.00 0.00 1.50 AGU 0.86 1.20 1.20 1.20 0.00 0.00 1.71 0.75 AGC 4.29 3.60 3.60 3.60 4.80 4.80 2.57 3.00 精氨酸
arginineCGU 0.00 0.00 0.00 0.00 0.00 0.00 1.20 0.00 CGC 1.71 2.25 2.25 2.25 2.25 2.00 0.00 0.75 CGA 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 CGG 2.57 2.25 2.25 2.25 1.50 2.00 3.60 3.00 AGA 0.86 0.75 0.75 0.75 0.75 0.67 0.00 0.00 AGG 0.86 0.75 0.75 0.75 1.50 1.33 1.20 2.25 缬氨酸
valineGUU 0.00 0.00 0.00 0.00 0.00 0.00 0.33 0.31 GUC 0.40 0.40 0.40 0.44 0.44 0.44 0.67 0.62 GUA 0.00 0.00 0.00 0.00 0.44 0.44 0.00 0.31 GUG 3.60 3.60 3.60 3.56 3.11 3.11 3.00 2.77 脯氨酸
prolineCCU 0.00 0.00 0.00 0.00 1.00 1.00 1.60 1.60 CCC 4.00 4.00 4.00 4.00 2.00 2.00 1.60 1.60 CCA 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.80 CCG 0.00 0.00 0.00 0.00 1.00 1.00 0.80 0.00 苏氨酸
threonineACU 0.89 0.50 0.50 0.50 0.44 0.44 0.00 0.00 ACC 2.22 2.50 2.50 2.50 2.22 2.22 2.67 2.00 ACA 0.89 1.00 1.00 1.00 0.89 0.89 0.89 0.80 ACG 0.00 0.00 0.00 0.00 0.44 0.44 0.44 1.20 丙氨酸
alanineGCU 1.33 1.07 1.00 0.89 1.07 1.33 0.33 1.60 GCC 2.13 2.13 2.25 2.00 2.67 2.4 2.67 1.60 GCA 0.27 0.27 0.25 0.22 0.27 0.27 1.00 0.40 GCG 0.27 0.53 0.50 0.89 0.00 0.00 0.00 0.40 甘氨酸
glycineGGU 0.44 0.44 0.50 0.44 0.44 0.44 0.00 0.00 GGC 0.89 0.89 1.00 0.89 0.89 0.89 1.00 1.14 GGA 1.33 1.33 1.00 1.33 1.33 1.78 1.50 0.57 GGG 1.33 1.33 1.50 1.33 1.33 0.89 1.50 2.29 异亮氨酸
isoleucineAUU 0.00 0.00 0.00 0.00 0.75 0.75 0.00 0.00 AUC 2.40 3.00 3.00 3.00 2.25 2.25 3.00 3.00 AUA 0.60 0.00 0.00 0.00 0.00 0.00 0.00 0.00 表3 (续) 氨基酸
amino acid密码子
codon水牛
Bubalus bubalis普通牛
Bos taurus杂交牛
Bos indicus×Bos taurus牦牛
Bos mutus绵羊
Ovis aries山羊
Capra hircus人类
Homo spaiens小鼠
Mus musculus组氨酸
histidineCAU 1.14 1.00 1.00 1.25 0.75 0.75 0.57 0.33 CAC 0.86 1.00 1.00 0.75 1.25 1.25 1.43 1.67 谷氨酰胺
glutamineCAA 0.00 0.00 0.00 0.00 0.00 0.00 0.20 0.22 CAG 2.00 2.00 2.00 2.00 2.00 2.00 1.80 1.78 天冬酰胺
asparagineAAU 0.00 0.00 0.00 0.00 0.00 0.00 0.67 0.00 AAC 2.00 2.00 2.00 2.00 2.00 2.00 1.33 2.00 赖氨酸
lysineAAA 1.00 0.86 1.00 1.00 1.00 1.00 0.67 1.00 AAG 1.00 1.14 1.00 1.00 1.00 1.00 1.33 1.00 酪氨酸
tyrosineUAU 0.00 0.00 0.00 0.00 0.00 0.00 0.40 0.80 UAC 2.00 2.00 2.00 2.00 2.00 2.00 1.60 1.20 天冬氨酸
asparticacidGAU 0.86 0.80 1.00 1.00 1.14 1.14 0.57 0.75 GAC 1.14 1.20 1.00 1.00 0.86 0.86 1.43 1.25 谷氨酸
glutamateGAA 0.53 0.38 0.56 0.50 0.63 0.63 0.47 0.94 GAG 1.47 1.63 1.44 1.50 1.38 1.38 1.53 1.06 半胱氨酸
cysteineUGU 0.00 0.00 0.00 0.00 0.00 0.00 1.00 0.67 UGC 2.00 2.00 2.00 2.00 2.00 2.00 1.00 1.33 苯丙氨酸
phenylalanineUUU 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 UUC 2.00 2.00 2.00 2.00 2.00 2.00 2.00 2.00 注:未列出RSCU为1的密码子及终止密码子。
Note: Codons with RSCU=1 and termination codon are not listed.表 4 THRSP基因密码子ENc、GC3s频率和GC含量Table 4. ENc, GC3s frequency and GC content of THRSP gene codons物种及对应的基因序列号
species and accession numbers of geneENc GC3s GC Bubalus bubalis_XM_006077389.3 33.98 0.752 0.581 Bos taurus_NM_001040533.1 33.95 0.791 0.602 Bos indicus×Bos taurus_XM_027531692.1 34.13 0.778 0.592 Bos mutus_XM_005908067.2 34.17 0.771 0.596 Ovis aries_XM_004019431.5 38.57 0.757 0.585 Capra hircus_XM_005699494.3 38.63 0.743 0.583 Oryx dammah_XM_040255623.1 41.69 0.793 0.609 Budorcas taxicolor_XM_052662536.1 44.22 0.752 0.592 Camelus dromedarius_XM_010990079.2_X1 39.89 0.781 0.594 Camelus bactrianus_XM_010973453.2_X1 39.89 0.781 0.594 Camelus ferus_XM_006191650.3_X1 39.25 0.772 0.590 Cervus elaphus_XM_043875526.1 35.35 0.796 0.622 Cervus hangul bactrianus_ENSCHYT00000006752.1 38.16 0.794 0.619 Equus asinus_XM_014859662.2_X1 40.36 0.759 0.602 Equus caballus_XM_005612013.3_X1 40.36 0.759 0.602 Sus scrofa_NM_001244376.1 40.68 0.769 0.590 Homo sapiens_NM_003251.4 41.09 0.766 0.598 Mus musculus_NM_009381.3 43.05 0.741 0.582 Felis catus_XM_003992699.6 42.25 0.764 0.581 Moschus moschiferus_ENSMMST00000007051.1 37.97 0.775 0.597 Gallus gallus_NM_213577.3 38.46 0.832 0.625 2.2 THRSP蛋白的理化特性和结构
2.2.1 理化特性
牛科物种THRSP蛋白的理化特性较为相似,都为定位于细胞核的亲水性蛋白质,不含跨膜区和信号肽,水牛与其他牛科物种的极性氨基酸含量、脂肪族指数、亲水性总平均值等指标差异较大;牛科物种THRSP的理化特性与鸡的差异最大,其次是人和小鼠(表5)。
表 5 牛科物种及非牛科物种THRSP理化特性Table 5. Physicochemical characteristics of THRSP in the species of Bovidae and non-Bovidae理化特性
physicochemical
characteristics水牛
Bubalus
bubalis普通牛
Bos
taurus杂交牛
Bos indicus×
Bos taurus牦牛
Bos
mutus绵羊
Ovis
aries山羊
Capra
hircus四川羚牛
Budorcas
taxicolor弯角剑羚
Oryx
dammah人类
Homo
sapiens小鼠
Mus musculus鸡
Gallus
gallus氨基酸数
number of
amino acid156 150 156 156 156 156 156 150 146 150 129 理论等电点
theoretical isoelectric point5.45 5.73 5.45 5.73 5.58 5.73 5.43 5.72 4.79 4.90 4.61 分子质量/ku
molecular
weight17.72 17.14 17.90 17.75 17.86 17.89 17.73 17.15 16.56 17.09 14.20 强酸性氨基酸
strongly acidic amino acids15 15 16 16 16 17 15 15 11 14 11 强碱性氨基酸
strongly basic amino acids22 21 24 22 23 23 23 21 24 25 19 疏水性氨基酸
hydrophobic
amino acids53 51 53 54 51 51 51 49 48 48 37 极性氨基酸
polar amino acids37 33 33 33 34 33 36 34 36 39 39 脂肪族指数
aliphatic index88.21 86.53 86.35 85.77 83.85 83.85 80.77 81.93 82.81 86.40 75.66 亲水性总平均值
grand average of
hydropathicity−0.298 −0.333 −0.358 −0.319 −0.391 −0.397 −0.434 −0.430 −0.385 −0.405 −0.601 2.2.2 THRSP基序组成模式和保守结构域
THRSP具有4种不同类型的基序组成模式(图2):模式a包含motif1~5,模式b比模式a缺少motif5和motif3,模式c包含motif1~4,模式d只包含motif1和motif2。除普通牛和弯角剑羚外,其他牛科物种THRSP基序组成都为模式a类型,与非牛科哺乳动物THRSP基序模式相似,但牛科与鸡差异较大。THRSP蛋白包含2种保守结构域,牛科物种中普通牛、杂交牛和牦牛以及除了原麝和鸡以外的其他非牛科物种的THRSP保守结构域为Spot_14,水牛、山羊、绵羊、弯角剑羚、四川羚羊、原麝和鸡的保守结构域为Spot_14超家族,牛科物种及其他非牛科动物保守结构域的位置大致相同。
2.2.3 牛科物种THRSP功能修饰位点
牛科物种THRSP蛋白功能修饰位点有2种,即酪蛋白激酶Ⅱ磷酸化位点和蛋白激酶C磷酸化位点;人和小鼠比牛科物种多了N-豆蔻酰化位点和N-糖基化位点,鸡比牛科物种多了N-豆蔻酰化位点、亮氨酸拉链结构以及cAMP和cGMP依赖性蛋白激酶磷酸化位点;牛科物种及其他非牛科哺乳动物相同功能磷酸化位点所处的位置相似,与鸡的差异较大(图3)。
2.2.4 二级结构和三维结构
牛科物种间THRSP蛋白二级结构元件的氨基酸比例相似,与其他非牛科动物的差异较大(表6)。水牛、牦牛和四川羚羊的THRSP蛋白三维结构与模板3ont.1.A的覆盖率为96% (AA:7~156),一致性为72.00%;杂交牛、绵羊和山羊的三维结构与模板3ont.1.A的一致性为73.33%,覆盖率为96% (AA:1~156);普通牛和弯角剑羚的三维结构与模型模板3ont.1.A的一致性和覆盖率分别为73.33%和100% (AA:1~150)(图4)。
表 6 THRSP蛋白4种二级结构的氨基酸占比Table 6. Amino acid proportion of four secondary structures in THRSP protein% 物种及对应的基因序列号
species and accession number of protein sequencesα螺旋
alpha helixβ折叠
beta turn延伸片段
extended strand无规则卷
random coilBubalus bubalis_XP_006077451.1 77.56 1.28 1.92 19.23 Bos taurus_NP_001035623.1 68.00 2.00 1.33 28.67 Bos indicus×Bos taurus_ XP_027387493.1 75.00 2.56 1.28 21.15 Bos mutus_XP_005908129.1 75.00 1.28 1.28 22.44 Ovis aries_XP_004019480.1 73.72 1.28 1.28 23.72 Capra hircus_XP_005699551.2 75.00 0.64 1.28 23.08 Oryx dammah_XP_040111557.1 74.00 2.00 1.33 22.67 Budorcas taxicolor_XP_052518496.1 76.28 1.92 1.28 20.51 图 4 牛科物种THRSP蛋白的三维结构注:a)水牛;b)普通牛;c)杂交牛;d)牦牛;e)绵羊;f)山羊;g)弯角剑羚;h)四川羚羊;下同。Figure 4. Three-dimensional structures of THRSP protein in the species of BovidaeNote: a) Bubalus bubalis; b) Bos taurus; c) Bos indicus×Bos taurus; d) Bos mutus; e) Ovis aries; f) Capra hircus; g) Oryx dammah; h) Budorcas taxicolor; the same as below.2.2.5 蛋白互作、参与的生物学路径和分子功能
各牛科物种与THRSP相互作用的蛋白质不尽相同,其中脂肪酸合成酶、甘油-3-磷酸酰基转移酶、乙酰辅酶A合成酶2和RAS癌基因家族成员是与THRSP互作的蛋白质(图5)。这些蛋白分子主要与脂肪酸的合成和β-氧化、蛋白质代谢和转运、跨细胞膜或细胞器的物质转运、溶酶体与吞噬体的融合、囊泡介导的物质运输等生物学过程有关。THRSP蛋白主要参与脂类的生物合成(GO:0046890)、脂肪酸代谢(GO:0006631)、乙酰辅酶A代谢(GO:0006084)、酰基辅酶A的生物合成(GO:0071616)等生物学过程,其分子功能主要与脂肪酸合酶活性(GO:0004312)和蛋白质同源二聚化活性(GO:0042803)相关。
2.2.6 序列一致性和系统发育分析
牛科物种THRSP基因包含2种长度的CDS(471和453 bp),其编码产物相差6个氨基酸。牛科物种间THRSP基因CDS及编码氨基酸序列的一致性高,其中核苷酸序列一致性为93.2%~96.9%,氨基酸序列一致性为91.3%~94.0%;牛科物种与非牛科哺乳动物的序列一致性较低,核苷酸和氨基酸的序列一致性分别为78.6%~95.3%和72.0%~94.6%;牛科与鸡的序列一致性最低,核苷酸和氨基酸的序列一致性分别为51.0%~52.8%和32.2%~35.5% (图6)。序列差异位点分析表明:位点c.79C、c.162T、c.191A、c.226A、c.423G和c.466G是区分牛属动物与水牛、羊属动物的核苷酸位点;位点c.91A、c.157A、c.180T、c.222A、c.253C、c.288C和c.423T是区分水牛与牛属、羊属动物的核苷酸位点;水牛特有的氨基酸位点为p.31S、p.59T、p.74I和p.85Q;p.54H、p.64N、p.76M、p.96E和p.156V是区分牛属动物与水牛、羊属动物的氨基酸位点;p.57T和p.90L是区分羊属动物与水牛、牛属动物的氨基酸位点(图7)。
图 6 牛科和非牛科物种THRSP基因核苷酸(a)及编码氨基酸(b)的序列一致性注:对角线以上为一致性,对角线以下为变异度。Figure 6. Consistency of THRSP nucleotides (a) and their encoded amino acid (b) sequences in the species of Bovidae and non-BovidaeNote: Above the diagonal is the percentage of consistency, below the diagonal is the percentage of variation.图 7 牛科和非牛科物种THRSP基因核苷酸(a)及编码氨基酸(b)序列的差异位点注:不同字母表示核苷酸或氨基酸替换,“.”表示与参考序列相同,“?”表示信息缺失。Figure 7. Difference sites in THRSP nucleotides (a) and their encoded amino acid (b) sequences in the species of Bovidae and non-BovidaeNote: Different letters indicate nucleotide or amino acid substitution, “.” represents the same as the reference sequence, “?” indicates that information is missing.基于各物种THRSP基因核苷酸和编码氨基酸序列构建的系统发育树聚类关系相似,牛科物种聚为一大支,其中水牛和牛属动物聚为一小支,羊属动物聚为单独的一小支;非牛科哺乳动物聚为一支(图8)。
3. 讨论
牛科家畜能为人类提供丰富的肉类、乳制品等畜产品,同时具有役用价值,在农业生产中具有重要地位。研究表明:THRSP基因与奶牛和山羊乳脂肪酸的从头合成、杂交牛的肌内脂肪和韩国牛的肌肉脂肪酸种类及胴体性状相关,是调节牛科家畜脂合成的重要功能基因,然而,目前关于该基因的研究主要涉及普通牛和山羊等少部分牛科家畜[7-8,14-15],对其他牛科家畜的研究鲜有报道。基于此,本研究采用比较基因组学和生物信息学分析方法对牛科家畜THRSP基因及其编码产物的理化特性和结构特征、蛋白互作以及参与的生物学路径与功能等进行了深入的比较分析,旨在阐明牛科动物THRSP在分子特征及功能上的差异。
本研究表明:牛科物种间THRSP基因CDS的长度存在差异,但碱基组成和CUB一致性高,其编码蛋白的理化特性、二级结构、3-D结构、基序组成模式、保守结构域、功能位点等高度相似,但呈现属间差异,与其他非牛科物种也具有一定的相似性;系统发育分析表明:牛科THRSP蛋白序列聚为一大支,表明牛科该蛋白的功能更为相似。可见,THRSP基因在牛科及非牛科哺乳动物中功能保守,但牛科家畜间的功能更为相似。已有研究发现:THRSP基因主要表达于肝脏、乳腺、皮下脂肪等组织,它能调节脂肪酸合成基因的转录,参与这些组织中脂肪酸的从头合成过程[2-3, 8, 16-17]。敲低Spot14小鼠的乳腺中三酰甘油(triacylglycerol,TAG)含量显著降低,表明Spot14是泌乳期小鼠乳腺脂肪酸从头合成所必需[2];Spot14还与泌乳期小鼠乳腺中中链脂肪酸(medium chain fatty acids,MCFA)的合成以及脂肪从头合成关键酶(fatty acid synthase, FASN)基因的表达相关[18];Spot14对人乳腺癌细胞的增殖和乳脂合成具有促进作用,敲低Spot14还会诱导细胞凋亡[19]。THRSP基因的表达还与牛肌肉[15]、脂肪[14]以及奶牛乳品质有关[7, 9-10]。如:韩国牛THRSP基因的多态性位点与肌肉大理石纹评分、脂肪酸组成及胴体性状相关联[15];夏洛莱牛×荷斯坦牛肌内脂肪酸含量与THRSP基因的表达量正相关[14];与低乳脂率奶牛相比,高乳脂率奶牛乳腺THRSP的mRNA和蛋白的相对表达量显著升高,且过表达牛乳腺上皮细胞中的THRSP基因,TAG含量显著增加,并上调FASN、过氧化物酶体增殖物激活受体γ (peroxisome proliferator-activated receptor γ,PPARγ)和固醇调节元件结合蛋白1 (sterol regulatory element binding protein 1,SREBP1)等重要脂肪生成酶基因的表达,提示THRSP基因能通过调节脂代谢基因的表达进而调节乳脂合成过程,其在乳腺中的表达量可能是奶牛乳脂率的标志[7];THRSP基因在山羊皮下脂肪组织的表达量最高,在乳腺的相对表达水平极低,但泌乳高峰期的表达量显著高于干奶期,对调节山羊乳腺上皮细胞的脂肪酸从头合成和去饱和过程具有重要作用[8]。
本研究还表明:牛科物种THRSP定位于细胞核,无跨膜区和信号肽序列,包含1个Spot_14或Spot_14超家族保守结构域,参与的生物学过程主要与脂类的生物合成、脂肪酸代谢、乙酰辅酶A代谢、酰基辅酶A的生物合成等相关,分子功能主要与脂肪酸合酶活性及蛋白质同源二聚化活性相关;与之互作的蛋白质分子主要与脂肪酸的合成和β-氧化、蛋白质代谢和转运、跨细胞膜或细胞器的物质转运、溶酶体与吞噬体的融合、囊泡介导的物质运输等生物学过程有关。因此,推测THRSP基因可能与牛科物种脂肪酸的合成过程相关,特别是参与了乳脂合成过程的调节。
4. 结论
牛科物种THRSP基因转录区的结构、CDS长度、碱基组成及其编码产物的理化特性和结构有一定差异,但具有较高的一致性。牛科THRSP蛋白均是定位于细胞核的亲水蛋白质,含有1个Spot_14或Spot_14超家族保守结构域,参与的生物学过程主要与脂类的生物合成有关,分子功能主要与脂肪酸合酶活性及蛋白质同源二聚化活性相关。推测THRSP蛋白参与了牛科物种脂合成(包括乳脂合成)的调节。
-
图 1 牛科物种及非牛科物种THRSP转录区的结构
注:物种及其基因序列号对应的物种中文名见表1。
Figure 1. Structure of THRSP gene in the species of Bovidae and non-Bovidae
Note: The Chinese names of species and accession number of gene sequences are shown in Tab.1.
图 4 牛科物种THRSP蛋白的三维结构
注:a)水牛;b)普通牛;c)杂交牛;d)牦牛;e)绵羊;f)山羊;g)弯角剑羚;h)四川羚羊;下同。
Figure 4. Three-dimensional structures of THRSP protein in the species of Bovidae
Note: a) Bubalus bubalis; b) Bos taurus; c) Bos indicus×Bos taurus; d) Bos mutus; e) Ovis aries; f) Capra hircus; g) Oryx dammah; h) Budorcas taxicolor; the same as below.
图 6 牛科和非牛科物种THRSP基因核苷酸(a)及编码氨基酸(b)的序列一致性
注:对角线以上为一致性,对角线以下为变异度。
Figure 6. Consistency of THRSP nucleotides (a) and their encoded amino acid (b) sequences in the species of Bovidae and non-Bovidae
Note: Above the diagonal is the percentage of consistency, below the diagonal is the percentage of variation.
图 7 牛科和非牛科物种THRSP基因核苷酸(a)及编码氨基酸(b)序列的差异位点
注:不同字母表示核苷酸或氨基酸替换,“.”表示与参考序列相同,“?”表示信息缺失。
Figure 7. Difference sites in THRSP nucleotides (a) and their encoded amino acid (b) sequences in the species of Bovidae and non-Bovidae
Note: Different letters indicate nucleotide or amino acid substitution, “.” represents the same as the reference sequence, “?” indicates that information is missing.
表 1 本研究所用序列
Table 1 Sequences used in this study
物种
species基因序列号
accession numbers of gene蛋白质序列号
accession numbers of protein编码区长度/bp
length of coding sequences水牛 Bubalus bubalis XM_006077389.3 XP_006077451.1 471 普通牛 Bos taurus NM_001040533.1 NP_001035623.1 453 杂交牛 Bos indicus×Bos taurus XM_027531692.1 XP_027387493.1 471 牦牛 Bos mutus XM_005908067.2 XP_005908129.1 471 绵羊 Ovis aries XM_004019431.5 XP_004019480.1 471 山羊 Capra hircus XM_005699494.3 XP_005699551.2 471 弯角剑羚 Oryx dammah XM_040255623.1 XP_040111557.1 453 四川羚羊 Budorcas taxicolor XM_052662536.1 XP_052518496.1 471 单峰驼 Camelus dromedarius XM_010990079.2 XP_010988381.1 471 单峰驼 Camelus dromedarius XM_010990085.2 XP_010988387.1 471 双峰驼 Camelus bactrianus XM_010973453.2 XP_010971755.1 471 双峰驼 Camelus bactrianus XM_010973454.2 XP_010971756.1 471 野骆驼 Camelus ferus XM_006191650.3 XP_006191712.1 471 野骆驼 Camelus ferus XM_014565117.2 XP_014420603.1 471 欧洲马鹿 Cervus elaphus XM_043875526.1 XP_043731461.1 471 布哈拉马鹿 Cervus hangul bactrianus ENSCHYT00000006752.1 NSCHYP00000006052 444 马 Equus caballus XM_005612013.3 XP_005612070.1 453 马 Equus caballus XM_023645649.1 XP_023501417.1 453 驴 Equus asinus XM_014859662.2 XP_014715148.1 453 驴 Equus asinus XM_044751944.1 XP_044607879.1 453 野猪 Sus scrofa NM_001244376.1 NP_001231305.1 471 家猫 Felis catus XM_003992699.6 XP_003992748.1 453 人 Homo sapiens NM_003251.4 NP_003242.1 441 小鼠 Mus musculus NM_009381.3 NP_033407.1 453 原麝 Moschus moschiferus ENSMMST00000007051.1 ENSMMSP00000006409 444 鸡 Gallus gallus NM_213577.3 NP_998742.2 390 表 2 THRSP基因CDS核苷酸组成
Table 2 Nnucleotide composition of THRSP CDS
% 物种及其基因序列号
species and number of gene sequencesA T G C A+T G+C Bubalus bubalis_XM_006077389.3 24.63 17.41 31.63 26.33 42.04 57.96 Bos taurus_NM_001040533.1 23.40 16.56 32.67 27.37 39.96 60.04 Bos indicus×Bos taurus_XM_027531692.1 24.42 16.56 32.06 26.96 40.98 59.02 Bos mutus_XM_005908067.2 23.99 16.56 32.27 27.18 40.55 59.45 Ovis aries_XM_004019431.5 24.84 16.77 31.21 27.18 41.61 58.39 Capra hircus_XM_005699494.3 24.84 16.99 31.21 26.96 41.83 58.17 Oryx dammah_XM_040255623.1 23.18 16.11 32.45 28.26 39.29 60.71 Budorcas taxicolor_XM_052662536.1 24.42 16.56 31.42 27.60 40.98 59.02 Camelus dromedarius_XM_010990079.2_X1 23.78 16.99 32.27 26.96 40.76 59.24 Camelus dromedarius_XM_010990085.2_X2 23.78 16.99 32.27 26.96 40.76 59.24 Camelus bactrianus_XM_010973453.2_X1 23.78 16.99 32.27 26.96 40.76 59.24 Camelus bactrianus_XM_010973454.2_X2 23.78 16.99 32.27 26.96 40.76 59.24 Camelus ferus_XM_006191650.3_X1 23.78 17.41 32.27 26.54 41.19 58.81 Camelus ferus_XM_014565117.2_X2 23.78 17.41 32.27 26.54 41.19 58.81 Cervus elaphus_XM_043875526.1 23.57 14.44 33.12 28.87 38.00 62.00 Cervus hangul bactrianus_ENSCHYT00000006752.1 23.42 14.64 33.33 28.60 38.06 61.94 Equus asinus_XM_014859662.2_X1 23.40 16.56 32.01 28.04 39.96 60.04 Equus asinus_XM_044751944.1_X2 23.40 16.56 32.01 28.04 39.96 60.04 Equus caballus_XM_005612013.3_X1 23.40 16.56 32.01 28.04 39.96 60.04 Equus caballus_XM_023645649.1_X2 23.40 16.56 32.01 28.04 39.96 60.04 Sus scrofa_NM_001244376.1 23.57 17.62 31.63 27.18 41.19 58.81 Homo sapiens_NM_003251.4 25.27 16.77 31.00 26.96 42.04 57.96 Mus musculus_NM_009381.3 24.26 16.10 31.97 27.66 40.36 59.64 Felis catus_XM_003992699.6 25.17 16.78 31.57 26.49 41.94 58.06 Moschus moschiferus_ENSMMST00000007051.1 23.42 16.89 32.88 26.80 40.32 59.68 Gallus gallus_NM_213577.3 23.33 14.36 29.49 32.82 37.69 62.31 注:物种及其基因序列号对应的物种中文名见表1;下同。
Note: The Chinese names of species and accession number of gene sequences are shown in Tab.1; the same as below.表 3 牛科及非牛科物种THRSP基因密码子的RSCU值
Table 3 RSCU values of THRSP gene codons in Bovidae and non-Bovidae
氨基酸
amino acid密码子
codon水牛
Bubalus bubalis普通牛
Bos taurus杂交牛
Bos indicus×Bos taurus牦牛
Bos mutus绵羊
Ovis aries山羊
Capra hircus人类
Homo spaiens小鼠
Mus musculus亮氨酸
leucineUUA 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 UUG 0.63 0.32 0.32 0.32 0.63 0.63 0.00 0.00 CUU 0.95 0.95 0.95 0.95 0.95 0.95 0.38 0.71 CUC 0.95 0.95 0.95 0.95 0.95 0.95 1.88 1.06 CUA 0.00 0.00 0.00 0.00 0.00 0.00 0.38 0.71 CUG 3.47 3.79 3.79 3.79 3.47 3.47 3.38 3.53 丝氨酸
serineUCU 0.86 0.00 0.00 0.00 0.00 0.00 0.00 0.00 UCC 0.00 1.20 1.20 1.20 1.20 1.20 0.86 0.75 UCA 0.00 0.00 0.00 0.00 0.00 0.00 0.86 0.00 UCG 0.00 0.00 0.00 0.00 0.00 0.00 0.00 1.50 AGU 0.86 1.20 1.20 1.20 0.00 0.00 1.71 0.75 AGC 4.29 3.60 3.60 3.60 4.80 4.80 2.57 3.00 精氨酸
arginineCGU 0.00 0.00 0.00 0.00 0.00 0.00 1.20 0.00 CGC 1.71 2.25 2.25 2.25 2.25 2.00 0.00 0.75 CGA 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 CGG 2.57 2.25 2.25 2.25 1.50 2.00 3.60 3.00 AGA 0.86 0.75 0.75 0.75 0.75 0.67 0.00 0.00 AGG 0.86 0.75 0.75 0.75 1.50 1.33 1.20 2.25 缬氨酸
valineGUU 0.00 0.00 0.00 0.00 0.00 0.00 0.33 0.31 GUC 0.40 0.40 0.40 0.44 0.44 0.44 0.67 0.62 GUA 0.00 0.00 0.00 0.00 0.44 0.44 0.00 0.31 GUG 3.60 3.60 3.60 3.56 3.11 3.11 3.00 2.77 脯氨酸
prolineCCU 0.00 0.00 0.00 0.00 1.00 1.00 1.60 1.60 CCC 4.00 4.00 4.00 4.00 2.00 2.00 1.60 1.60 CCA 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.80 CCG 0.00 0.00 0.00 0.00 1.00 1.00 0.80 0.00 苏氨酸
threonineACU 0.89 0.50 0.50 0.50 0.44 0.44 0.00 0.00 ACC 2.22 2.50 2.50 2.50 2.22 2.22 2.67 2.00 ACA 0.89 1.00 1.00 1.00 0.89 0.89 0.89 0.80 ACG 0.00 0.00 0.00 0.00 0.44 0.44 0.44 1.20 丙氨酸
alanineGCU 1.33 1.07 1.00 0.89 1.07 1.33 0.33 1.60 GCC 2.13 2.13 2.25 2.00 2.67 2.4 2.67 1.60 GCA 0.27 0.27 0.25 0.22 0.27 0.27 1.00 0.40 GCG 0.27 0.53 0.50 0.89 0.00 0.00 0.00 0.40 甘氨酸
glycineGGU 0.44 0.44 0.50 0.44 0.44 0.44 0.00 0.00 GGC 0.89 0.89 1.00 0.89 0.89 0.89 1.00 1.14 GGA 1.33 1.33 1.00 1.33 1.33 1.78 1.50 0.57 GGG 1.33 1.33 1.50 1.33 1.33 0.89 1.50 2.29 异亮氨酸
isoleucineAUU 0.00 0.00 0.00 0.00 0.75 0.75 0.00 0.00 AUC 2.40 3.00 3.00 3.00 2.25 2.25 3.00 3.00 AUA 0.60 0.00 0.00 0.00 0.00 0.00 0.00 0.00 表3 (续) 氨基酸
amino acid密码子
codon水牛
Bubalus bubalis普通牛
Bos taurus杂交牛
Bos indicus×Bos taurus牦牛
Bos mutus绵羊
Ovis aries山羊
Capra hircus人类
Homo spaiens小鼠
Mus musculus组氨酸
histidineCAU 1.14 1.00 1.00 1.25 0.75 0.75 0.57 0.33 CAC 0.86 1.00 1.00 0.75 1.25 1.25 1.43 1.67 谷氨酰胺
glutamineCAA 0.00 0.00 0.00 0.00 0.00 0.00 0.20 0.22 CAG 2.00 2.00 2.00 2.00 2.00 2.00 1.80 1.78 天冬酰胺
asparagineAAU 0.00 0.00 0.00 0.00 0.00 0.00 0.67 0.00 AAC 2.00 2.00 2.00 2.00 2.00 2.00 1.33 2.00 赖氨酸
lysineAAA 1.00 0.86 1.00 1.00 1.00 1.00 0.67 1.00 AAG 1.00 1.14 1.00 1.00 1.00 1.00 1.33 1.00 酪氨酸
tyrosineUAU 0.00 0.00 0.00 0.00 0.00 0.00 0.40 0.80 UAC 2.00 2.00 2.00 2.00 2.00 2.00 1.60 1.20 天冬氨酸
asparticacidGAU 0.86 0.80 1.00 1.00 1.14 1.14 0.57 0.75 GAC 1.14 1.20 1.00 1.00 0.86 0.86 1.43 1.25 谷氨酸
glutamateGAA 0.53 0.38 0.56 0.50 0.63 0.63 0.47 0.94 GAG 1.47 1.63 1.44 1.50 1.38 1.38 1.53 1.06 半胱氨酸
cysteineUGU 0.00 0.00 0.00 0.00 0.00 0.00 1.00 0.67 UGC 2.00 2.00 2.00 2.00 2.00 2.00 1.00 1.33 苯丙氨酸
phenylalanineUUU 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 UUC 2.00 2.00 2.00 2.00 2.00 2.00 2.00 2.00 注:未列出RSCU为1的密码子及终止密码子。
Note: Codons with RSCU=1 and termination codon are not listed.表 4 THRSP基因密码子ENc、GC3s频率和GC含量
Table 4 ENc, GC3s frequency and GC content of THRSP gene codons
物种及对应的基因序列号
species and accession numbers of geneENc GC3s GC Bubalus bubalis_XM_006077389.3 33.98 0.752 0.581 Bos taurus_NM_001040533.1 33.95 0.791 0.602 Bos indicus×Bos taurus_XM_027531692.1 34.13 0.778 0.592 Bos mutus_XM_005908067.2 34.17 0.771 0.596 Ovis aries_XM_004019431.5 38.57 0.757 0.585 Capra hircus_XM_005699494.3 38.63 0.743 0.583 Oryx dammah_XM_040255623.1 41.69 0.793 0.609 Budorcas taxicolor_XM_052662536.1 44.22 0.752 0.592 Camelus dromedarius_XM_010990079.2_X1 39.89 0.781 0.594 Camelus bactrianus_XM_010973453.2_X1 39.89 0.781 0.594 Camelus ferus_XM_006191650.3_X1 39.25 0.772 0.590 Cervus elaphus_XM_043875526.1 35.35 0.796 0.622 Cervus hangul bactrianus_ENSCHYT00000006752.1 38.16 0.794 0.619 Equus asinus_XM_014859662.2_X1 40.36 0.759 0.602 Equus caballus_XM_005612013.3_X1 40.36 0.759 0.602 Sus scrofa_NM_001244376.1 40.68 0.769 0.590 Homo sapiens_NM_003251.4 41.09 0.766 0.598 Mus musculus_NM_009381.3 43.05 0.741 0.582 Felis catus_XM_003992699.6 42.25 0.764 0.581 Moschus moschiferus_ENSMMST00000007051.1 37.97 0.775 0.597 Gallus gallus_NM_213577.3 38.46 0.832 0.625 表 5 牛科物种及非牛科物种THRSP理化特性
Table 5 Physicochemical characteristics of THRSP in the species of Bovidae and non-Bovidae
理化特性
physicochemical
characteristics水牛
Bubalus
bubalis普通牛
Bos
taurus杂交牛
Bos indicus×
Bos taurus牦牛
Bos
mutus绵羊
Ovis
aries山羊
Capra
hircus四川羚牛
Budorcas
taxicolor弯角剑羚
Oryx
dammah人类
Homo
sapiens小鼠
Mus musculus鸡
Gallus
gallus氨基酸数
number of
amino acid156 150 156 156 156 156 156 150 146 150 129 理论等电点
theoretical isoelectric point5.45 5.73 5.45 5.73 5.58 5.73 5.43 5.72 4.79 4.90 4.61 分子质量/ku
molecular
weight17.72 17.14 17.90 17.75 17.86 17.89 17.73 17.15 16.56 17.09 14.20 强酸性氨基酸
strongly acidic amino acids15 15 16 16 16 17 15 15 11 14 11 强碱性氨基酸
strongly basic amino acids22 21 24 22 23 23 23 21 24 25 19 疏水性氨基酸
hydrophobic
amino acids53 51 53 54 51 51 51 49 48 48 37 极性氨基酸
polar amino acids37 33 33 33 34 33 36 34 36 39 39 脂肪族指数
aliphatic index88.21 86.53 86.35 85.77 83.85 83.85 80.77 81.93 82.81 86.40 75.66 亲水性总平均值
grand average of
hydropathicity−0.298 −0.333 −0.358 −0.319 −0.391 −0.397 −0.434 −0.430 −0.385 −0.405 −0.601 表 6 THRSP蛋白4种二级结构的氨基酸占比
Table 6 Amino acid proportion of four secondary structures in THRSP protein
% 物种及对应的基因序列号
species and accession number of protein sequencesα螺旋
alpha helixβ折叠
beta turn延伸片段
extended strand无规则卷
random coilBubalus bubalis_XP_006077451.1 77.56 1.28 1.92 19.23 Bos taurus_NP_001035623.1 68.00 2.00 1.33 28.67 Bos indicus×Bos taurus_ XP_027387493.1 75.00 2.56 1.28 21.15 Bos mutus_XP_005908129.1 75.00 1.28 1.28 22.44 Ovis aries_XP_004019480.1 73.72 1.28 1.28 23.72 Capra hircus_XP_005699551.2 75.00 0.64 1.28 23.08 Oryx dammah_XP_040111557.1 74.00 2.00 1.33 22.67 Budorcas taxicolor_XP_052518496.1 76.28 1.92 1.28 20.51 -
[1] SEELIG S, LIAW C, TOWLE H C, et al. Thyroid hormone attenuates and augments hepatic gene expression at a pretranslational level[J]. Proceedings of the National Academy of Sciences, 1981, 78(8): 4733. DOI: 10.1073/pnas.78.8.4733.
[2] ZHU Q H, ANDERSON G W, MUCHA G T, et al. The Spot 14 protein is required for de novo lipid synthesis in the lactating mammary gland[J]. Endocrinology, 2005, 146(8): 3343. DOI: 10.1210/en.2005-0204.
[3] WANG X F, CARRE W, ZHOU H J, et al. Duplicated Spot 14 genes in the chicken: characterization and identification of polymorphisms associated with abdominal fat traits[J]. Gene, 2004, 332(1): 79. DOI: 10.1016/j.gene.2004.02.021.
[4] CUNNINGHAM B A, MALONEY M, KINLAW W B. Spot 14 protein-protein interactions: evidence for both homo- and heterodimer formation in vivo[J]. Endocrinology, 1997, 138(12): 5184. DOI: 10.1210/endo.138.12.5597.
[5] KIM C W, MOON Y A, PARK S W, et al. Induced polymerization of mammalian acetyl-CoA carboxylase by MIG12 provides a tertiary level of regulation of fatty acid synthesis[J]. Proceedings of the National Academy of Sciences, 2010, 107(21): 9626. DOI: 10.1073/pnas.1001 292107.
[6] COLBERT C L, KIM C W, MOON Y A, et al. Crystal structure of Spot 14, a modulator of fatty acid synthesis[J]. Proceedings of the National Academy of Sciences, 2010, 107(44): 18820. DOI: 10.1073/pnas.1012736107.
[7] CUI Y J, LIU Z Y, SUN X, et al. Thyroid hormone responsive protein Spot 14 enhances lipogenesis in bovine mammary epithelial cells[J]. In Vitro Cellular & Developmental Biology-Animal, 2015, 51(6): 586. DOI: 10.1007/s11626-014-9865-8.
[8] YAO D W, LUO J, HE Q Y, et al. Thyroid hormone responsive (THRSP) promotes the synthesis of medium-chain fatty acids in goat mammary epithelial cells[J]. Journal of Dairy Science, 2016, 99(4): 3124. DOI: 10.3168/jds.2015-10632.
[9] 刘智宇, 李庆章, 高学军, 等. Thrsp 在不同乳品质奶牛乳腺中的表达及其对乳脂合成的影响[J]. 中国乳品工业, 2014, 42(9): 19. DOI: 10.3969/j.issn.1001-2230.2014. 09.005. [10] 孙霞, 曲波, 李庆章, 等. THRSP 在泌乳期高、低乳品质奶牛乳腺组织中的蛋白表达及定位[J]. 中国乳品工业, 2015, 43(4): 7. DOI: 10.3969/j.issn.1001-2230.2015.04.002. [11] CHEN C J, CHEN H, ZHANG Y, et al. TBtools: an integrative toolkit developed for interactive analyses of big biological data[J]. Molecular Plant, 2020, 13(8): 1194. DOI: 10.1016/j.molp.2020.06.009.
[12] BAILEY T L, JOHNSON J, GRANT C E, et al. The MEME suite[J]. Nucleic Acids Research, 2015, 43(W1): W39. DOI: 10.1093/nar/gkv416.
[13] KUMAR S, STECHER G, TAMURA K. MEGA7: molecular evolutionary genetics analysis version 7.0 for bigger datasets[J]. Molecular Biology and Evolution, 2016, 33(7): 1870. DOI: 10.1093/molbev/msw054.
[14] SCHERING L, ALBRECHT E, KOMOLKA K, et al. Increased expression of thyroid hormone responsive protein (THRSP) is the result but not the cause of higher intramuscular fat content in cattle[J]. International Journal of Biological Sciences, 2017, 13(5): 532. DOI: 10.7150/ijbs.18775.
[15] OH D Y, LEE Y S, LA B M, et al. Identification of exonic nucleotide variants of the thyroid hormone responsive protein gene associated with carcass traits and fatty acid composition in Korean cattle[J]. Asian-Australasian Journal of Animal Sciences, 2014, 27(10): 1373. DOI: 10.5713/ajas.2014.14101.
[16] ZHU Q, MARIASH A, MARGOSIAN M R, et al. Spot 14 gene deletion increases hepatic de novo lipogenesis[J]. Endocrinology, 2001, 142(10): 4363. DOI: 10.1210/endo. 142.10.8431.
[17] COMPE E, DE SOUSA G, FRANÇOIS K, et al. Spot 14 protein interacts and co-operates with chicken ovalbumin upstream promoter-transcription factor 1 in the transcription of the L-type pyruvate kinase gene through a specificity protein 1 (Sp1) binding site[J]. Biochemical Journal, 2001, 358(1): 175. DOI: 10.1042/0264-6021:35 80175.
[18] RUDOLPH M C, WELLBERG E A, LEWIS A S, et al. Thyroid hormone responsive protein Spot14 enhances catalysis of fatty acid synthase in lactating mammary epithelium[J]. Journal of Lipid Research, 2014, 55(6): 1052. DOI: 10.1194/jlr.M044487.
[19] KINLAW W B, QUINN J L, WELLS W A, et al. Spot 14: a marker of aggressive breast cancer and a potential therapeutic target[J]. Endocrinology, 2006, 147(9): 4048. DOI: 10.1210/en.2006-0463.
-
期刊类型引用(1)
1. 李亚芬,刀文彬,范新阳,苗永旺. 鸡Ⅱ型角蛋白基因家族成员鉴定及其功能的生物信息学分析. 云南农业大学学报(自然科学). 2024(06): 34-47 . 百度学术
其他类型引用(0)