基于高通量测序的日本医蛭转录组及SSR序列分析
Transcriptome and SSR Analysis Based on RNA-Seq in Hirudo nipponia
-
Keywords:
- Hirudo nipponia /
- transcriptome /
- simple sequence repeats (SSR)
-
植原体(phytoplasma)是一类非螺旋状、无细胞壁且专性寄生于韧皮部的植物病原微生物。植原体主要依靠叶蝉和飞虱等媒介昆虫进行传播,亦可由植物营养繁殖材料和菟丝子等方式进行传播,感病植株通常表现为丛枝、花变叶、黄化、矮化和节间缩短等症状,目前植原体可危害1 000多种植物,给多种经济作物的生产造成了严重影响[1-3]。
植原体的系统发育进化关系及分类鉴定主要依赖于高度保守的16S rRNA基因序列的遗传变异性[4-5]。目前基于16S rRNA基因序列RFLP分析的相似系数对植原体株系进行划分,已确定了36个16Sr组和150多个亚组[6-7]。然而在植原体分类鉴定体系中,以高度保守的16S rDNA序列信息作为唯一的系统发育依据,在鉴定亲缘关系密切的植原体株系上存在缺陷且难以对组内植原体株系进行更精确的分类鉴定[8]。为解决植原体分类学的局限性,研究人员开始利用保守性相对较低的非核糖体基因,如核糖体蛋白(rp)基因和secY基因等作为辅助分类的分子遗传标记,有助于更准确地对植原体16Sr组内株系的真实系统发育关系进行更精细的划分,可进一步将植原体16Sr组划分为多个不同的亚组[9-12]。
小驳骨(Gendarussa vulgaris Nees)又名驳骨草、接骨草等,属于双子叶植物纲唇形目爵床科(Acanthaceae)驳骨草属(Gendarussa Nees),具有极高的药用价值[13-14]。2019年,课题组在元谋地区发现的疑似感染植原体而诱发的丛枝症状小驳骨病株,其植株生长缓慢、矮化、节间缩短、腋芽丛生为簇状并且大部分叶片萎缩变小并黄化,这将会降低小驳骨的产质量和药用价值。
基于作为系统发育分子标记的rp和secY基因具有能够高度准确地辨别16Sr组中亚组间的系统发育关系的能力,同时利用多个系统发育参数可以更好地识别和定义植原体株系。本研究将采用PCR技术等研究方法对小驳骨植原体16S rRNA、rp及secY基因进行扩增及序列测定,根据这3个基因的序列信息构建系统发育树进行系统发育关系的比较分析,最终从亚组水平上准确高效地鉴定小驳骨丛枝植原体株系的分类地位。同时通过对secY蛋白亚基的蛋白特性、蛋白跨膜结构及信号肽进行分析,从蛋白分泌途径初步了解植原体病害的致病机理,为研究小驳骨植原体病害的发生及防治提供理论支持。
1. 材料与方法
1.1 试验材料与主要试剂
自然表现丛枝症状的小驳骨植株采自云南省元谋县,并保存于实验室,并以实验室保存的苦楝丛枝植原体病株为阳性对照。
新型快速植物基因DNA提取试剂盒及PCR产物纯化试剂盒由百泰克生物技术有限公司提供;DNA Marker、TransStart® FastPfu DNA Polymerase和克隆载体试剂盒pEASY®-Blunt Simple Clonging Kit均来自北京全式金生物技术有限公司;引物由硕擎生物科技有限公司合成。
1.2 方法
1.2.1 感病小驳骨植株总DNA提取和PCR扩增
选取感病小驳骨植株幼嫩叶片进行总DNA提取,提取总DNA步骤参照新型快速植物基因DNA提取试剂盒说明书。
以小驳骨病样总DNA为模板,参照PÉREZ-LÓPEZ等[7]和LEE等[8]设计的植原体通用引物对P1/P7和R16F2n/R16R2对植原体16S rRNA基因通过巢式PCR进行扩增,同时采用引物对rp (II) F1/rp (II) R1、secY-F/secY-R分别对 rp和secY基因进行直接PCR扩增。引物合成序列见表1。16S rRNA及rp基因的PCR扩增反应条件参考万琼莲等[15]的研究;secY基因的PCR扩增反应条件为95 ℃ 2 min,95 ℃ 20 s,45 ℃ 20 s,72 ℃ 40 s,35 cycle,72 ℃延伸 5 min。
表 1 引物序列表Table 1. Primer sequence listing基因 gene 引物名称 primer name 序列 sequence 预期扩增片段长度/bp expected amplified fragment length 16S rRNA P1 5′-AAGAGTTTGATCCTGGCTCAGGATT-3′ 1 800 P7 5′-CGTCCTTCATCGGCTCTT-3′ R16F2n 5′-GAAACGACTGCTAAGACT-3′ 1 248 R16R2 5′-TGACGGGCGGTGTGTACAAACCCCG-3′ rp rp(II)F1 5′-GCTCTTACTCGTAAAYATGTAGT-3′ 1 171 rp(II)R1 5′-TTACTTGATTTTCTGGTTTTGA-3′ secY secY-F 5′-GCGGAAGAAGCTATTAT-3′ 1 425 secY-R 5′-CGAATAACATAATATAATTGATTCC-3′ 1.2.2 16S rRNA、rp和secY基因序列的克隆及测定
PCR扩增产物在1%琼脂糖凝胶中进行电泳检测,对PCR产物进行纯化,并与载体pEASY®-Blunt Simple Cloning Vector连接转化到化学感受态细胞Trans1-T1 Phage Resistant中,37 ℃培养1 h后取100 µL均匀涂布于经IPTG和X-gal处理过的LB培养基平板上,过夜培养,第2天进行蓝白斑的挑选以及菌液PCR的阳性克隆子检测,将含有目的基因片段的菌液送生工测序公司进行序列测定。
1.2.3 16S rRNA、rp及secY基因序列分析
将测序所获得的16S rRNA、rp及secY基因的核苷酸序列用Vector NTI 11.5.3.软件去除序列两端的载体,以确定测序结果的准确性。利用NCBI中的ORF Finder (https://www.ncbi.nlm.nih.gov/orffinder/)寻找rp和secY序列的最大开放阅读框并进行分析。将序列提交到NCBI中BLAST比对确认,并进行同源序列检索;采用MUSCLE(https://www.ebi.ac.uk/Tools/msa/muscle/)对序列进行在线同源性比对,分析基于16SrII组各植原体16S rRNA、rp及secY基因序列的亲缘关系。利用MEGA X软件,以邻接法(neighbour-joining)构建分别基于16S rRNA、rp及secY基因的系统进化树以便进行系统发育关系的比较分析,确定小驳骨丛枝植原体株系的分类地位。16S rRNA基因序列通过植原体在线分析网站iPhyClassifier (https://plantpathology.ba.ars.usd a.gov/cgibin/resource/iphyclassifier.cgi)进行虚拟RFLP分析鉴定,明确该株系的候选种分类地位。相关植原体株系信息如表2。
表 2 植原体各株系16S rRNA、rp和secY基因序列登录号Table 2. The accession No. of 16S rRNA, rp gene and secY gene sequence of phytoplasma strain植原体病害及相关菌株
phytoplasma diseases and strains地理来源
geographical origin16Sr 组-亚组
16Sr group-subgroupGenBank登录号 GenBank accession No. 16S rRNA secY rp 云南元谋番茄巨芽植原体
tomato big bud, TBB-YM/ TBBP-YNym中国云南
Yunnan, China16SrII-A JQ923436 KC953016 KC953010 花生丛枝植原体
peanut witches’-broom, PnWB中国台湾
Taiwan, China16SrII-A L33765 GU004331 EF193375 云南元谋番茄丛枝植原体
tomato witches’-broom, TWB-YNym中国云南
Yunnan, China16SrII-A KC953005 KC953017 KC953011 云南元谋四季豆花变绿植原体
string bean virescence, SbV-YNym2中国云南
Yunnan, China16SrII-A KJ735766 — — 芝麻花变叶植原体
Candidatus phytoplasma aurantifolia, SEPB2泰国
Thailand16SrII-A JN006079 — — 云南元谋兵豆花变绿植原体
‘Lens culinaris’ virescence, LeVP-YNym中国云南
Yunnan, China16SrII-A — KJ735763 KJ735764 云南元谋豇豆花变叶植原体
cowpea phyllody, CowP-YNym中国云南
Yunnan, China16SrII-A KC953001 — — 云南元谋豇豆花变绿植原体
cowpea virescence, CoVP-YNym中国云南
Yunnan, China16SrII-A — KC953013 KC953007 黑豆丛枝植原体
black gram witches’-broom, BgWB缅甸
Myanmar16SrII-A AB690304 AB703249 AB703243 黄瓜花变叶植原体
cucumber phyllody, CuPh伊朗
Iran16SrII-A KY349111 KY365527 KY365523 云南元谋菊苣从枝植原体
‘Cichorium intybus’ witches’-broom,
CiWB-YNym/ChWB-YNym中国云南
Yunnan, China16SrII-A KJ735774 KJ735775 — 柠檬从枝植原体
lime witches’-broom, LWB阿曼
Oman16SrII-B EF186828 — — 棉花花变叶植原体
cotton phyllody, CoP布基纳法索
Burkina Faso16SrII-C EF186827 GU004350 EF186814 猪屎豆花变叶植原体
Crotalaria phyllody, CrP泰国
Thailand16SrII-C EF193355 GU004349 EF186818 大豆花变叶植原体
soybean phyllody, SOYP泰国
Thailand16SrII-C EF193353 GU004324 EF186816 刺缘毛莲菜花变叶植原体
Picris echioides phyllody, PEP意大利
Italy16SrII-E Y16393 GU004348 EF193381 桃黄化植原体
peach X-disease,CX加拿大
Canada16SrIII-A L33733 GU004327 EF186813 三叶草黄化植原体
clover yellow edge, CYE立陶宛
Lithuania16SrIII-B AF173558 GU004332 JQ360962 核桃丛枝植原体
walnut witches’-broom, WWB美国乔治亚州
Georgia, USA16SrIII-G AF190227 GU004325 JQ360961 榆树黄化植原体
elm yellows, ‘Ca.P.ulmi’EYEu (EY-626、EY-627)意大利
Italy16SrV-A AY197657 AY197691 AY197678 悬钩子矮化植原体
rubus stunt, RUS意大利
Italy16SrV-E AY197648 AY197696 AY197668 马铃薯丛枝植原体
potato witches’-broom, ‘Ca.P.trifolli’PWB加拿大
Canada16SrVI-A AY500818 GU004316 AY197683 白蜡木黄化植原体
ash yellows, AshY1美国纽约
New York, USA16SrVII-A AF092209 GU004329 EF183492 欧洲核果黄化/李子坏死植原体
European stone fruit yellows/ plum, ‘Ca.P. prunorum’PLN德国/意大利
Germany/Italy16SrX-B AJ542545 GU004334 EF193369 绣球花花变叶植原体
hydrangea phyllody, HYDP比利时
Belgium16SrI-A AY265215 AY803181 AY264868 报春花花变绿植原体
primrose virescence, PRIVC德国
Germany16SrI-B AY265210 AY803176 AY264854 三叶草花变叶植原体
clover phyllody, CPh加拿大
Canada16SrI-C AF222065 AY803179 AY264862 蓝莓矮化植原体
blueberry stunt, BBS3美国
USA16SrI-E AY265213 GU004357 AY264863 1.2.4 secY基因编码的蛋白亚基的蛋白特性分析及结构预测
分别通过生物信息学在线分析网站ProtParam (http://web.expasy.org/protparam/)、Protscale (https://web.expasy.org/protscale/)、TMHMM (http://www.cbs.dtu.dk/services/TMHMM-2.0/)和SignalP (http://www.cbs.dtu.dk/ services/SignalP/)对secY基因编码的蛋白特性、蛋白亲疏水性、蛋白跨膜结构区和信号肽进行分析。
2. 结果与分析
2.1 小驳骨丛枝病症状
由图1所示:感病小驳骨植株严重矮化,节间明显缩短,侧芽细弱,枝条丛生成簇状,叶片小而黄。
2.2 序列结果分析
2.2.1 16S rRNA、rp和secY基因序列扩增结果
小驳骨感病植株总DNA经PCR扩增,均得到大小与阳性对照一致的特异性条带,而双蒸水和健康植株总DNA均未扩增出特异性条带。测序结果表明:从小驳骨感病植株样品总DNA中分别扩增得到了1248 bp的16S rRNA基因片段(nested PCR) (MN535183)、1171 bp的rp基因片段(MN543078)及1425 bp的secY基因片段(MN543069),这与预期扩增片段长度相符。由此将该植原体株系命名为云南元谋小驳骨丛枝植原体(Gendarussa vulgaris witches’-broom phytoplasma,GvWB-YNym)。
2.2.2 小驳骨丛枝植原体(GvWB-YNym) 16S rRNA、rp以及secY基因序列分析
(1) 16S rRNA基因序列分析
经BLAST搜索,显示GvWB-YNym的16S rRNA基因序列与16SrII-A亚组为最佳匹配同源序列。经MUSCLE进行在线比对结果(表3)所示:该序列片段与16SrII-A亚组的番茄巨芽植原体(Tomato big bud,TBB-YM,GenBank 登录号:JQ923436)的相似率高达100.00%。由图2所示:GvWB-YNym与植原体16SrII组明显聚为一枝,且又与归属为16SrII-A亚组的番茄巨芽植原体(Tomato big bud,TBB-YM,GenBank 登录号:JQ923436)及来自云南元谋的菊苣丛枝植原体(‘Cichorium intybus’ witches’-broom,CiWB-YNym,GenBank 登录号:KJ735774)处于同一枝。
表 3 小驳骨丛枝植原体(GvWB-YNym)16S rRNA、rp和secY基因核苷酸序列与部分16SrII亚组株系的同源性分析Table 3. Homology analysis of nucleotide sequences between GvWB-YNym 16S rRNA, rp and secY gene with other phytoplasma strains of 16SrII subgroup植原体菌株
phytoplasma strains亚组
subgroupGenBank登录号 GenBank accession No. 核苷酸同源性/% nucleotide homologous 16S rRNA secY rp 16S rRNA secY rp TBB-YM/ TBBP-YNym 16SrII-A JQ923436 KC953016 KC953010 100.00 99.93 99.83 PnWB 16SrII-A L33765 GU004331 EF193375 99.60 99.79 99.74 TWB-YNym 16SrII-A KC953005 KC953017 KC953011 99.68 99.86 100.00 BgWB 16SrII-A AB690304 AB703249 AB703243 99.68 100.00 99.91 CuPh 16SrII-A KY349111 KY365527 KY365523 99.44 99.84 99.82 CoP 16SrII-C EF186827 GU004350 EF186814 98.08 88.43 90.76 CrP 16SrII-C EF193355 GU004349 EF186818 98.00 88.25 90.51 SOYP 16SrII-C EF193353 GU004324 EF186816 98.00 87.44 90.60 PEP 16SrII-E Y16393 GU004348 EF193381 98.08 88.23 90.26 (2) rp基因序列的分析
将测序所得的rp基因序列提交到NCBI网站ORF Finder进行在线分析,分析结果表明:rp序列包含了rps3 (nt550-1170)基因部分序列和rpl22 (nt90-476)基因全部序列,分别编码了206和128个氨基酸。由表3所示:该序列与16SrII-A亚组各株系相似率均高于99.74%,且与16SrII-A亚组中的番茄丛枝(TWB-YNym)相似率高达100%。由图2所示:GvWB-YNym与16SrII-A亚组同处1个分枝簇上,且与16SrII组聚为一大进化枝,这与基于16S rRNA基因序列构建的系统发育树具有相近之处,表明植原体类群之间具有相似的关联性。因此,依据rp基因序列可将GvWB-YNym归为16SrII-A亚组。
(3) secY基因序列的分析
将secY基因序列提交至NCBI网站ORF Finder进行在线分析,结果显示:secY基因序列包含了整个secY基因(nt74-1336),编码了420个氨基酸。由表3所示:GvWB-YNym与植原体16SrII-A亚组中的5个植原体相似率达99.79%以上,与16SrII-A亚组中的印度黑豆丛枝(BgWB)相似率达到100%。由图2所示:secY基因与16SrII-A亚组的各个成员共同聚为一群,而与16SrII组其他亚组及其他外组亲缘关系相对较远;这也与基于rp基因和16S rRNA基因构建的系统发育树显示出相似的主次分枝顺序。据此结果推断,将GvWB-YNym划分为16SrII-A亚组。
2.2.3 小驳骨丛枝植原体(GvWB-YNym)16S rRNA基因在线分类鉴定结果
经iPhyClassifier在线分类鉴定结果显示:该株系16S rRNA基因序列与16SrII-A亚组代表性植原体花生丛枝植原体株系(L33765)相似性最高,相似系数高达1.00,且二者间的16S rDNA F2n/R2序列片段模拟RFLP图谱完全一致,上述所有分类结果均显示GvWB-YNym归属为16SrⅡ-A亚组。同时,在线分析还显示:GvWB-YNym与候选种‘Candidatus Phytoplasma aurantifolia’(U15442)同源性最高,达98.2%,因此可确定GvWB-YNym候选种与‘Ca.Phytoplasma aurantifolia’相关。
2.2.4 secY基因编码的蛋白亚基生物信息学分析
经分析工具ProtParam对GvWB-YNym的secY蛋白理化特性进行分析,结果显示其编码了420个氨基酸,分子量为47 720.21 u,理论等电点9.68,脂肪系数为136.45,不稳定系数31.94,属于稳定蛋白,总平均亲水性数值为0.664,表明该蛋白疏水性较好,属疏水性蛋白。通过在线分析网站Protscale对secY蛋白亲疏水性作进一步分析,结果如图3所示。从整体来看,该蛋白疏水氨基酸(正值)多于亲水氨基酸(负值),表现为疏水性,与物理特性预测结果一致;其在215和216位氨基酸疏水性分值最高(3.661),疏水性最强;在238和239位氨基酸亲水性分值最低(−2.678),亲水性最强。
图 3 secY蛋白亲疏水性分析注:从左到右横向为氨基酸序列顺序;零水平线上方为疏水位点;零水平线下方为亲水位点。Figure 3. Hydrophilic analysis of secY proteinNotes: The horizontal direction is the amino acid sequence from left to right; the hydrophobic level is above the zero horizontal line; the hydrophilic position is below the zero horizontal line.以在线跨膜结构区预测软件TMHMM分析secY蛋白的跨膜域,结果(图4a)显示:该蛋白氨基酸序列具有10个显著且分布相对均匀的跨膜螺旋区域,表明该蛋白可能定位于细胞中与膜相关的结构,属于跨膜蛋白。信号肽是负责把蛋白引导到不同膜结构的亚细胞器内的短肽链,通过SignalP在线分析工具对secY基因进行信号肽分析,分析结果如图4b所示:GvWB-YNym的secY蛋白不存在信号肽。
图 4 secY蛋白跨膜结构及信号肽分析注:a) secY蛋白跨膜结构预测;b) secY蛋白信号肽预测,C-score. 原始剪切位点的分值,S-score. 信号肽的分值,Y-score. 综合剪切位点的分值。Figure 4. TMHMM posterior probabilities and prediction of the signal peptide of secY proteinNotes: a) membrane localization prediction; b) signal peptide prediction, C-score. original cut score, S-score. signal score, Y-score. general score.3. 讨论
由于植原体难以体外培养,多方面研究均落后于其他细菌,目前植原体的分类鉴定及其亲缘进化关系的研究领域仍然是热点。高度保守的16S rRNA基因序列常被用作植原体的系统发育进化关系及分类鉴定遗传标记[5]。随着计算机技术及网络系统的加速发展和日渐成熟完善,16S rRNA基因的虚拟RFLP图谱分析在植原体快速分类鉴定以及流行病学研究的分类学中越来越重要[16]。根据IRPCM (2004)规定[17],16S rRNA基因序列与现有序列间的同源性大于97.5%时可被认为是相同组的植原体。然而,基于植原体中高度保守的16S rRNA基因序列的2.5%不同的任意阈值对植原体株系进行分组的依据,不能满足16S rRNA基因序列同源性虽大于97.5%但在植物寄主范围和介体昆虫等方面具有独特生态学和生物学的植原体株系进行分类的要求。因此,为了能在分子水平上更准确地区分植原体株系,便需要引入额外的分子标记。而作为辅助分类的其他遗传标记如核糖体蛋白(rp)基因、secY、tuf和23S rRNA基因以及16S-23S rRNA基因间隔区序列已被广泛应用。
比较分析给定的PnWB组(16SrII)各亚组之间的同源性发现:secY基因的序列相似性变化范围最大,其次为rp基因和16S rRNA基因;GvWB-YNym与16SrII-A亚组的亲缘关系最为接近,16S rRNA和rp基因序列在16SrII-A亚组各株系上表现出高相似性,但rp及secY基因序列比16S rRNA基因序列能够呈现出更大的遗传变异性,而secY基因相较于rp基因的序列又具有更大的可变程度,这些信息能够极大地增强对植原体组内遗传进化关系密切但不同亚组的分类鉴定能力,且与前人的研究[12, 18-22]具有一致性。通过基于16S rRNA、rp及secY基因构建的系统发育进化树分析,也能够支持这一论断。根据16S rRNA、rp及secY基因序列构建的系统发育进化树,都显示GvWB-YNym与16SrII-A亚组的各植原体株系形成单系群,且与其他16SrII组植原体聚为一大亚枝,但与16SrII组外的其他亚组植原体明显划分为不同进化枝。这3个系统进化树分析能够显著区分开植原体株系组与亚组之间的关系,进一步证实了以rp及secY基因作为分类辅助标记的可信度和重要性,是对利用16S rRNA基因对植原体进行分类的补充依据,也表明了GvWB-YNym归属到16SrII-A亚组的准确性。然而,分别基于16S rRNA、rp及secY基因构建的系统进化树中的各个分枝顺序并不完全一致,表明16S rRNA、rp及secY基因在其各自的进化史上遗传变异程度的不一致性。16S rDNA序列的RFLP分析代表不同的系统发育谱系,依据植原体在线分类网站iPhyClassifier对GvWB-YNym进行快速分类,结果表明GvWB-YNym与候选种‘Ca.Phytoplasma aurantifolia’相关,且与16SrII-A亚组代表性植原体株系花生丛枝植原体(L33765)的16S rDNA F2n/R2序列片段模拟RFLP图谱完全一致,进一步证实了将GvWB-YNym归属为16SrII-A亚组分类地位的准确性。这是小驳骨丛枝植原体的首次报道。
原核生物细胞的生长和发育依赖于Sec分泌蛋白转运机制,多数分泌蛋白和整合膜蛋白都需要经由此途径进行转运,其中起重要作用的是膜蛋白三聚体SecYEG和动力蛋白secA。在Sec转运酶中,secY、secE、secG和secA构成作为细胞质膜的输出机制中的转位酶复合物,secA、secE和secY是蛋白质易位和细胞活力必不可少的部分。在蛋白转运过程中,前体蛋白经由secA携带的伴胞分子的引导,同时利用ATP酶的水解活性促进该蛋白质穿过三聚体SecYEG形成的跨膜通道到达膜外[23]。植原体有2个分泌系统,YidC和Sec,后者几乎是绝大多数或所有植原体的共同分泌系统,KAKIZAWA等[24]发现:植原体中存在Sec系统,而secA和secY蛋白是其中重要组成部分,但其并不清楚Sec系统在植原体中的作用机制。岳红妮等[25]研究发现:泡桐丛枝(PaWB)植原体中同样存在的Sec分泌蛋白转运系统,并猜测该系统可能会直接将细菌蛋白质如毒素等转运到宿主细胞质或寄主昆虫细胞中,从而诱发宿主病症。本研究通过对secY蛋白进行生物信息参数的分析发现:该蛋白作为疏水性稳定跨膜蛋白存在于感病小驳骨植株中;secY蛋白含10个显著疏水跨膜区域,与大肠杆菌中的secY蛋白具有相似的跨膜结构区[26],这种膜包埋的结构可赋予secY蛋白“转运蛋白”功能,为膜蛋白的分泌提供通道,但secY蛋白中不存在信号肽。由于植原体缺乏细胞壁,其细胞膜可直接与寄主植物的细胞内环境进行接触,一些与致病性相关的致病因子可能通过Sec转运系统直接释放到宿主细胞中,导致植株韧皮部功能受损,从而诱发寄主产生抗病性,影响植物的防御响应,进而直接或间接地导致寄主植物或介体昆虫发生互作,诱使寄主植物发生典型植原体病害症状。但secY蛋白在植原体内转运机制中扮演的具体角色尚不明确,还有待进一步研究和证实,本研究将为了解Sec转运系统在植原体的分子致病机制及防治植原体病害上提供更大的帮助。
4. 结论
本研究是首次对小驳骨丛枝植原体病害的相关报道,明确了小驳骨丛枝病是由植原体所侵染发生的,确定了该植原体株系16S rII-A亚组的分类地位;同时对secY蛋白在Sec分泌蛋白转运系统中的作用进行了初步探讨,为了解Sec转运系统在植原体的分子致病机理及防治此类病害提供帮助
-
图 3 日本医蛭GO分类
注:1. 生物相;2. 单有机体过程;3. 多有机体过程;4. 生长;5. 移动;6. 生物正调控过程;7. 发育过程;8. 组织或生物源的细胞组分;9. 节奏进程;10. 细胞过程;11. 新陈代谢过程;12. 信号;13. 细胞聚集;14. 免疫反应过程;15. 生物黏附;16. 生殖过程;17. 生物负调控过程;18. 行为;19. 多细胞生物体过程;20. 生物调节;21. 解毒;22. 生殖;23. 刺激反应;24. 生物过程调控;25. 定位;26. 细胞杀伤;27. 病毒部分;28. 细胞外区域;29. 突触成分;30. 其他有机体;31. 细胞;32. 细胞器;33. 突触;34. 细胞结合;35. 膜包围的内腔;36. 细胞膜成分;37. 细胞成分;38. 细胞外基质;39. 其他有机体成分;40. 病毒;41. 细胞外区域成分;42. 细胞外基质成分;43. 大分子聚合物;44. 细胞膜;45. 内核;46. 细胞器成分;47. 分子传导活力;48. 催化活性;49. 连接功能;50. 载体活性;51. 金属伴侣活性;52. 转录因子活性,蛋白质结合;53. 分子功能调节;54. 抗氧化活性;55. 结构分子活力;56. 核苷酸连接转录因子活性。
Figure 3. GO classification
Note:1. biological phase; 2. single-organism process; 3. multi-organism process; 4. growth; 5. locomotion; 6. positive regulation of biological process; 7. developmental process; 8. cellular component organization or biogenesis; 9. rhythmic process; 10. cellular process; 11. metabolic process; 12. signaling; 13. cell aggregation; 14. immune system process; 15. biological adhesion; 16. reproductive process; 17. negative regulation of biological process; 18. behavior; 19. multicellular organismal process; 20. biological regulation; 21. detoxification; 22. reproduction; 23. response to stimulus; 24. regulation of biological process; 25. localization; 26. cell killing; 27. virion part; 28. extracellular region; 29. synapse part; 30. other organism; 31. cell; 32. organelle; 33. synapse; 34. cell junction; 35. membrane-enclosed lumen; 36. membrane part; 37. cell part; 38. extracellular matrix; 39. other organism part; 40. virion; 41. extracellular region part; 42. extracellular matrix component; 43. macromolecular complex; 44. membrane; 45. nucleoid; 46. organelle part; 47. molecular transducer activity; 48. catalytic activity; 49. binding; 50. transporter activity; 51. metallochaperone activity; 52. transcription factor activity, protein binding; 53. molecular function regulator; 54. antioxidant activity; 55. structural molecule activity; 56. nucleic acid binding transcription factor activity.
表 1 不同温度下日本医蛭各组织测序数据统计
Table 1 Statistical data of RNA-seq for H. nipponia at different temperatures
样本 samples 原始数据 raw reads 清洁数据 clean reads 碱基数量/G clean bases 错误率/% error Q20/% Q30/% GC百分比/% GC percent H24_1 45 431 080 44 676 774 6.70 0.03 97.50 92.58 41.88 H24_2 45 719 004 44 872 164 6.73 0.03 97.30 92.14 41.71 H24_3 47 655 932 46 815 800 7.02 0.03 97.28 92.11 43.10 C24_1 45 996 730 45 117 404 6.77 0.03 97.23 92.01 42.27 C24_2 51 090 894 49 760 010 7.46 0.03 97.32 92.23 42.28 C24_3 47 917 682 46 952 310 7.04 0.03 97.47 92.52 42.43 M24_1 50 189 638 49 072 616 7.36 0.03 97.48 92.54 42.73 M24_2 47 912 728 47 118 008 7.07 0.03 97.33 92.20 42.49 M24_3 47 104 418 45 704 948 6.86 0.03 97.37 92.37 43.34 H18_1 48 066 694 47 299 224 7.09 0.03 97.24 92.03 41.95 H18_2 46 001 150 45 192 382 6.78 0.03 97.32 92.25 42.16 H18_3 46 693 840 45 834 804 6.88 0.03 97.26 92.10 42.20 C18_1 45 453 330 44 652 910 6.70 0.03 97.29 92.10 42.89 C18_2 48 072 830 47 297 166 7.09 0.03 97.36 92.27 42.95 C18_3 46 965 374 45 732 230 6.86 0.03 97.51 92.60 42.65 M18_1 47 919 804 46 592 206 6.99 0.03 97.41 92.42 41.69 M18_2 46 058 130 45 030 182 6.75 0.03 97.40 92.38 42.28 M18_3 47 057 392 46 211 360 6.93 0.03 97.39 92.34 42.28 表 2 拼接转录本长度分布
Table 2 Distribution of number and quality of unigenes and transcripts
项目
item最小长度/bp
Min. length平均长度/bp
mean length最大长度/bp
Max. lengthN50总条数
N50 total numberN90总条数
N90 total number总条数
total number总核苷酸/nt
total nucleotides独立基因 unigenes 301 1 390 30 853 2 483 520 52 206 72 566 318 转录本 transcripts 301 1 826 30 853 2 894 820 202 570 369 978 282 表 3 日本医蛭独立基因注释数量统计
Table 3 The statistical number of unigene that were functional annotated in H. nipponia
数据库
database非重复序列基因数
number of unigene比例/%
percentageNR 21 967 42.07 NT 6 379 12.21 KO 6 408 12.27 SwissProt 16 852 32.27 Pfam 22 984 44.02 GO 22 984 44.02 KOG 9 849 18.86 能被所有数据库注释数目
annotated in all databases1 705 3.26 至少被1个数据库注释数目
annotated in at least one database29 352 56.22 总独立基因数目
total unigene52 206 100 表 4 日本医蛭SSR不同核苷酸重复基元的类型及频率
Table 4 Types and frequencies of different nucleotide repeat motifs of SSR in H. nipponia
重复基元类型
repeat motif length重复次数
repeat number总计
total频数/%
frequency5 6 7 8 9 10 >10 A/T 2 490 1 765 4 255 14.22 C/G 115 149 264 0.88 AC/GT − 112 47 28 22 12 37 258 0.86 AG/CT − 84 40 29 17 18 55 243 0.81 AT/AT − 239 150 104 57 34 83 667 2.23 AAC/GTT 1 315 705 405 213 196 109 139 3 082 10.30 AAT/ATT 2 485 1 201 766 536 777 507 803 7 075 23.64 ATC/ATG 3 935 2 139 1 248 745 579 397 453 9 496 31.73 AAAT/ATTT 221 68 35 5 1 3 5 338 1.13 AATG/ATTC 110 54 67 10 2 1 34 278 0.93 ATCC/ATGG 199 126 159 34 9 20 115 662 2.21 AAAAT/ATTTT 6 3 9 0.03 AACAT/ATGTT 7 2 1 10 0.03 AATAT/ATATT 8 1 1 1 4 15 0.05 AATGAT/ATCATT 4 1 1 6 0.02 ACCATC/ATGGTG 3 1 1 1 6 0.02 ACGATG/ATCGTC 50 4 4 10 3 3 1 75 0.25 总计 total 8 343 4 739 2 922 1 714 1 664 3 712 3 645 26 739 89.35 频数/% frequency 82.88 87.08 88.81 91.61 95.52 98.86 96.97 89.35 表 5 差异表达基因数
Table 5 Number of differentially expressed genes
组织
tissue差异表达基因
all DEGs下调基因
down-regulated genes上调基因
up-regulated genesH18 vs H24 434 223 211 C18 vs C24 591 400 191 M18 vs M24 578 216 362 -
[1] 杨潼. 中国动物志, 环节动物门, 蛭纲[M]. 北京: 科学出版社, 1996. [2] 余米, 刘嘉, 周梦, 等. 日本医蛭生境水质及生物学特性初探[J]. 中药材, 2019, 42(12): 2782. DOI: 10.13863/j.issn1001-4454.2019.12.009. [3] LIU Z C, ZHAO F, TONG X R, et al. Comparative transcriptomic analysis reveals the mechanism of leech environmental adaptation[J]. Gene, 2018, 664: 70. DOI: 10.1016/j.gene.2018.04.063.
[4] KHAN M S, GUAN D, KVIST S, et al. Transcriptomics and differential gene expression in Whitmania pigra (Annelida: Clitellata: Hirudinida: Hirudinidae): contrasting feeding and fasting modes[J]. Ecology and Evolution, 2019, 9(8): 4706. DOI: 10.1002/ece3.5074.
[5] 邢月婷, 管峰, 李诗语, 等. 日本医蛭唾液腺对饥饿胁迫响应的转录组比较[J]. 水产学报, 2020, 44(5): 754. [6] GRABHERR M G, HAAS B J, YASSOUR M, et al. Full-length transcriptome assembly from RNA-Seq data without a reference genome[J]. Nature Biotechnology, 2011, 29(7): 644. DOI: 10.1038/nbt.1883.
[7] ALTSCHUL S F, MADDEN T L, Schaffer A A, et al. Gapped BLAST and PSI-BLAST: a new generation of protein database search programs[J]. Nucleic Acids Research, 1997, 25(17): 3389. DOI: 10.1093/nar/25.17.3389.
[8] MORIYA Y, ITOH M, OKUDA S, et al. KAAS: an automatic genome annotation and pathway reconstruction server[J]. Nucleic Acids Research, 2007, 35: 182. DOI: 10.1093/nar/gkm321.
[9] FINN R D, TATE J, MISTRY J, et al. The Pfam protein families database[J]. Nucleic Acids Research, 2008, 36: 281. DOI: 10.1093/nar/gkh121.
[10] GOTZ S, GARCIAGOMEZ J M, TEROL J, et al. High-throughput functional annotation and data mining with the Blast2GO suite[J]. Nucleic Acids Research, 2008, 36(10): 3420. DOI: 10.1093/nar/gkn176.
[11] LI B, DEWEY C N. RSEM: accurate transcript quantification from RNA-Seq data with or without a reference genome[J]. BMC Bioinformatics, 2011, 12(1): 323. DOI: 10.1186/1471-2105-12-323.
[12] 王斌, 孙静, 刘凌云, 等. 蛭类转录组中EST-SSR分析及抗凝血相关分子标记的挖掘[J]. 中草药, 2017, 48(1): 172. DOI: 10.7501/j.issn.0253-2670.2017.01.024. [13] 孟玮, 蒋艳琳, 张林, 等. 基于RNA-seq技术的江鳕转录组SSR位点信息分析[J]. 淡水渔业, 2019, 49(6): 10. DOI: 10.13721/j.cnki.dsyy.2019.06.002. [14] 陈松波, 龚丽, 刘海金. 牙鲆EST资源的SSR信息分析[J]. 东北农业大学学报, 2010, 41(10): 82. DOI: 10.19720/j.cnki.issn.1005-9369.2010.10.016. [15] 刘洪涛, 刘金叶, 杨明秋, 等. 基于转录组测序的波纹唇鱼SSR和SNP多态特征分析[J]. 基因组学与应用生物学, 2020, 39(6): 2451. DOI: 10.13417/j.gab.039.002451. [16] 王且鲁, 刘奕, 宋红梅, 等. 双须骨舌鱼转录组EST-SSR标记开发与引物筛选[J]. 淡水渔业, 2016, 46(6): 8. DOI: 10.13721/j.cnki.dsyy.2016.06.002. [17] FRICKE C, WIGBY S, HOBBS R, et al. The benefits of male ejaculate sex peptide transfer in Drosophila melanogaster[J]. Journal of Evolutionary Biology, 2009, 22(2): 275. DOI: 10.1111/j.1420-9101.2008.01638.x.
[18] WIGBY S, CHAPMAN T. Sex peptide causes mating costs in female Drosophila melanogaster[J]. Current Biology, 2005, 15(4): 316. DOI: 10.1016/j.cub.2005.01.051.
[19] SANDRA G, NORMA M. Sexual determination and differentiation in teleost fish[J]. Reviews in Fish Biology and Fisheries, 2010, 20(1): 101. DOI: 10.1007/s11160-009-9123-4.
[20] HATTORI R S, STRUSSMANN C A, FERNANDINO J I, et al. Genotypic sex determination in teleosts: insights from the testis-determining amhy gene[J]. General and Comparative Endocrinology, 2013, 192: 55. DOI: 10.1016/j.ygcen.2013.03.019.
[21] MARTINEZ P, VINAS A, SANCHEZ L, et al. Genetic architecture of sex determination in fish: applications to sex ratio control in aquaculture[J]. Frontiers in Genetics, 2014, 5: 340. DOI: 10.3389/fgene.2014.00340.