• 中国科学引文数据库(CSCD)来源期刊
  • 中文核心期刊
  • 中国农林核心期刊(A类)
  • 中国高校百佳科技期刊

基于高通量测序的日本医蛭转录组及SSR序列分析

余米, 封孝兰, 周梦, 张承露, 曹敏

余米, 封孝兰, 周梦, 等. 基于高通量测序的日本医蛭转录组及SSR序列分析[J]. 云南农业大学学报(自然科学), 2021, 36(2): 250-259. DOI: 10.12101/j.issn.1004-390X(n).202004062
引用本文: 余米, 封孝兰, 周梦, 等. 基于高通量测序的日本医蛭转录组及SSR序列分析[J]. 云南农业大学学报(自然科学), 2021, 36(2): 250-259. DOI: 10.12101/j.issn.1004-390X(n).202004062
Mi YU, Xiaolan FENG, Meng ZHOU, et al. Transcriptome and SSR Analysis Based on RNA-Seq in Hirudo nipponia[J]. JOURNAL OF YUNNAN AGRICULTURAL UNIVERSITY(Natural Science), 2021, 36(2): 250-259. DOI: 10.12101/j.issn.1004-390X(n).202004062
Citation: Mi YU, Xiaolan FENG, Meng ZHOU, et al. Transcriptome and SSR Analysis Based on RNA-Seq in Hirudo nipponia[J]. JOURNAL OF YUNNAN AGRICULTURAL UNIVERSITY(Natural Science), 2021, 36(2): 250-259. DOI: 10.12101/j.issn.1004-390X(n).202004062

基于高通量测序的日本医蛭转录组及SSR序列分析

基金项目: 重庆市科学技术局项目(cstc2018jxjl-jbky00003、cstc2019jscx-msxmX0357);重庆市卫健委“药用动物学”重点学科建设
详细信息
    作者简介:

    余米(1987—),男,四川巴中人,硕士,助理研究员,主要从事药用水生动物养殖开发利用。E-mail:344565975@qq.com

    通信作者:

    曹敏(1988—),女,四川宜宾人,硕士,助理研究员,主要从事中药资源调查与保育。E-mail:962103004@qq.com

  • 中图分类号: S 917.4

摘要:
目的 分析日本医蛭在不同温度处理下,其转录组和简单重复序列标记(simple seauence repeats,SSR) 信息。
方法 应用高通量测序技术,对不同温度下日本医蛭不同组织分别进行转录组测序,采用MISA软件对unigene进行SSR分析。
结果 共获得 125.08 G有效数据,平均错误率为0.03%。经 Trinity 软件混合拼接后共得到202 570 条 transcripts 和52 206 条unigene,平均长度分别为1 826 bp 和1 390 bp,最大长度均为30 853 bp。将unigene 与公共数据库进行比对,得到注释的 unigene 为29 352 条,占总数的56.22%。对unigene 进行SSR检测,共检测到29 926个SSR位点,发生频率是57.32%。SSR的核苷酸基元重复数都在5 次以上,主要集中在5~10 次(86.27%)之间,以三核苷酸和单核苷酸重复SSR为主,所占比例分别为74.07%和15.10%,核苷酸重复基元中,以 A/T (4 255,14.22%)为主,在三核苷酸重复基元中,ATC/ATG (9 496,31.73%) 所占比例最高。不同温度下日本医蛭转录组基因表达量差异比较数据显示,样本间表达差异基因共1 603 个。
结论 不同温度处理后日本医蛭的SSR发生频率较高,可为日本医蛭筛选分子遗传标记提供大量基础数据。

 

Transcriptome and SSR Analysis Based on RNA-Seq in Hirudo nipponia

Abstract:
Purpose To analyze the transcriptome and SSR information of Hirudo nipponia under different temperatures.
Method Illumina HiSeq high-throughput sequencing technology and MISA software were applied to obtain the transcriptome and SSRs from different tissues of H. nipponia at different temperatures.
Result The 125.08 G effective data was obtained with an average error rate of 0.03%. After assembly by the software Trinity, a total of 202 570 transcripts and 52 206 unigenes were generated, corresponding to maximum length of 30 853 bp both, the average lengh of 1 826 bp and 1 390 bp respectively. Using BLASTX against the public databases, 29 352 unigenes were annotated at least one databases, accounting for 56.22% of the total. In addition, 29 926 potential SSR loci were detected, with a frequency of 57.32%. Trinucleotide and mononucleotide were major types, accounting for 74.07% and 15.10%, respectively. ATC/ATG (9 496) and A/T(4 255) were respectively most frequent motifs in trinucleotide and mononucleotide repeats, accounting for 31.73% and 14.22%, respectively. There were 1 603 differentially expressed genes among the samples.
Conclusion The SSR of H. nipponia has a high frequency, which provides basis for the screening of molecular genetic markers.

 

  • 植原体(phytoplasma)是一类非螺旋状、无细胞壁且专性寄生于韧皮部的植物病原微生物。植原体主要依靠叶蝉和飞虱等媒介昆虫进行传播,亦可由植物营养繁殖材料和菟丝子等方式进行传播,感病植株通常表现为丛枝、花变叶、黄化、矮化和节间缩短等症状,目前植原体可危害1 000多种植物,给多种经济作物的生产造成了严重影响[1-3]

    植原体的系统发育进化关系及分类鉴定主要依赖于高度保守的16S rRNA基因序列的遗传变异性[4-5]。目前基于16S rRNA基因序列RFLP分析的相似系数对植原体株系进行划分,已确定了36个16Sr组和150多个亚组[6-7]。然而在植原体分类鉴定体系中,以高度保守的16S rDNA序列信息作为唯一的系统发育依据,在鉴定亲缘关系密切的植原体株系上存在缺陷且难以对组内植原体株系进行更精确的分类鉴定[8]。为解决植原体分类学的局限性,研究人员开始利用保守性相对较低的非核糖体基因,如核糖体蛋白(rp)基因和secY基因等作为辅助分类的分子遗传标记,有助于更准确地对植原体16Sr组内株系的真实系统发育关系进行更精细的划分,可进一步将植原体16Sr组划分为多个不同的亚组[9-12]

    小驳骨(Gendarussa vulgaris Nees)又名驳骨草、接骨草等,属于双子叶植物纲唇形目爵床科(Acanthaceae)驳骨草属(Gendarussa Nees),具有极高的药用价值[13-14]。2019年,课题组在元谋地区发现的疑似感染植原体而诱发的丛枝症状小驳骨病株,其植株生长缓慢、矮化、节间缩短、腋芽丛生为簇状并且大部分叶片萎缩变小并黄化,这将会降低小驳骨的产质量和药用价值。

    基于作为系统发育分子标记的rpsecY基因具有能够高度准确地辨别16Sr组中亚组间的系统发育关系的能力,同时利用多个系统发育参数可以更好地识别和定义植原体株系。本研究将采用PCR技术等研究方法对小驳骨植原体16S rRNArpsecY基因进行扩增及序列测定,根据这3个基因的序列信息构建系统发育树进行系统发育关系的比较分析,最终从亚组水平上准确高效地鉴定小驳骨丛枝植原体株系的分类地位。同时通过对secY蛋白亚基的蛋白特性、蛋白跨膜结构及信号肽进行分析,从蛋白分泌途径初步了解植原体病害的致病机理,为研究小驳骨植原体病害的发生及防治提供理论支持。

    自然表现丛枝症状的小驳骨植株采自云南省元谋县,并保存于实验室,并以实验室保存的苦楝丛枝植原体病株为阳性对照。

    新型快速植物基因DNA提取试剂盒及PCR产物纯化试剂盒由百泰克生物技术有限公司提供;DNA Marker、TransStart® FastPfu DNA Polymerase和克隆载体试剂盒pEASY®-Blunt Simple Clonging Kit均来自北京全式金生物技术有限公司;引物由硕擎生物科技有限公司合成。

    选取感病小驳骨植株幼嫩叶片进行总DNA提取,提取总DNA步骤参照新型快速植物基因DNA提取试剂盒说明书。

    以小驳骨病样总DNA为模板,参照PÉREZ-LÓPEZ等[7]和LEE等[8]设计的植原体通用引物对P1/P7和R16F2n/R16R2对植原体16S rRNA基因通过巢式PCR进行扩增,同时采用引物对rp (II) F1/rp (II) R1、secY-F/secY-R分别对 rpsecY基因进行直接PCR扩增。引物合成序列见表116S rRNArp基因的PCR扩增反应条件参考万琼莲等[15]的研究;secY基因的PCR扩增反应条件为95 ℃ 2 min,95 ℃ 20 s,45 ℃ 20 s,72 ℃ 40 s,35 cycle,72 ℃延伸 5 min。

    表  1  引物序列表
    Table  1.  Primer sequence listing
    基因 gene引物名称 primer name序列 sequence预期扩增片段长度/bp expected amplified fragment length
    16S rRNA P1 5′-AAGAGTTTGATCCTGGCTCAGGATT-3′ 1 800
    P7 5′-CGTCCTTCATCGGCTCTT-3′
    R16F2n 5′-GAAACGACTGCTAAGACT-3′ 1 248
    R16R2 5′-TGACGGGCGGTGTGTACAAACCCCG-3′
    rp rp(II)F1 5′-GCTCTTACTCGTAAAYATGTAGT-3′ 1 171
    rp(II)R1 5′-TTACTTGATTTTCTGGTTTTGA-3′
    secY secY-F 5′-GCGGAAGAAGCTATTAT-3′ 1 425
    secY-R 5′-CGAATAACATAATATAATTGATTCC-3′
    下载: 导出CSV 
    | 显示表格

    PCR扩增产物在1%琼脂糖凝胶中进行电泳检测,对PCR产物进行纯化,并与载体pEASY®-Blunt Simple Cloning Vector连接转化到化学感受态细胞Trans1-T1 Phage Resistant中,37 ℃培养1 h后取100 µL均匀涂布于经IPTG和X-gal处理过的LB培养基平板上,过夜培养,第2天进行蓝白斑的挑选以及菌液PCR的阳性克隆子检测,将含有目的基因片段的菌液送生工测序公司进行序列测定。

    将测序所获得的16S rRNArpsecY基因的核苷酸序列用Vector NTI 11.5.3.软件去除序列两端的载体,以确定测序结果的准确性。利用NCBI中的ORF Finder (https://www.ncbi.nlm.nih.gov/orffinder/)寻找rpsecY序列的最大开放阅读框并进行分析。将序列提交到NCBI中BLAST比对确认,并进行同源序列检索;采用MUSCLE(https://www.ebi.ac.uk/Tools/msa/muscle/)对序列进行在线同源性比对,分析基于16SrII组各植原体16S rRNArpsecY基因序列的亲缘关系。利用MEGA X软件,以邻接法(neighbour-joining)构建分别基于16S rRNArpsecY基因的系统进化树以便进行系统发育关系的比较分析,确定小驳骨丛枝植原体株系的分类地位。16S rRNA基因序列通过植原体在线分析网站iPhyClassifier (https://plantpathology.ba.ars.usd a.gov/cgibin/resource/iphyclassifier.cgi)进行虚拟RFLP分析鉴定,明确该株系的候选种分类地位。相关植原体株系信息如表2

    表  2  植原体各株系16S rRNArpsecY基因序列登录号
    Table  2.  The accession No. of 16S rRNA, rp gene and secY gene sequence of phytoplasma strain
    植原体病害及相关菌株
    phytoplasma diseases and strains
    地理来源
    geographical origin
    16Sr 组-亚组
    16Sr group-subgroup
    GenBank登录号 GenBank accession No.
    16S rRNAsecYrp
    云南元谋番茄巨芽植原体
    tomato big bud, TBB-YM/ TBBP-YNym
    中国云南
    Yunnan, China
    16SrII-A  JQ923436 KC953016 KC953010
    花生丛枝植原体
    peanut witches’-broom, PnWB
    中国台湾
    Taiwan, China
    16SrII-A  L33765 GU004331 EF193375
    云南元谋番茄丛枝植原体
    tomato witches’-broom, TWB-YNym
    中国云南
    Yunnan, China
    16SrII-A  KC953005 KC953017 KC953011
    云南元谋四季豆花变绿植原体
    string bean virescence, SbV-YNym2
    中国云南
    Yunnan, China
    16SrII-A  KJ735766
    芝麻花变叶植原体
    Candidatus phytoplasma aurantifolia, SEPB2
    泰国
    Thailand
    16SrII-A  JN006079
    云南元谋兵豆花变绿植原体
    ‘Lens culinaris’ virescence, LeVP-YNym
    中国云南
    Yunnan, China
    16SrII-A KJ735763 KJ735764
    云南元谋豇豆花变叶植原体
    cowpea phyllody, CowP-YNym
    中国云南
    Yunnan, China
    16SrII-A  KC953001
    云南元谋豇豆花变绿植原体
    cowpea virescence, CoVP-YNym
    中国云南
    Yunnan, China
    16SrII-A KC953013 KC953007
    黑豆丛枝植原体
    black gram witches’-broom, BgWB
    缅甸
    Myanmar
    16SrII-A  AB690304 AB703249 AB703243
    黄瓜花变叶植原体
    cucumber phyllody, CuPh
    伊朗
    Iran
    16SrII-A  KY349111 KY365527 KY365523
    云南元谋菊苣从枝植原体
    Cichorium intybus’ witches’-broom,
    CiWB-YNym/ChWB-YNym
    中国云南
    Yunnan, China
    16SrII-A  KJ735774 KJ735775
    柠檬从枝植原体
    lime witches’-broom, LWB
    阿曼
    Oman
    16SrII-B  EF186828
    棉花花变叶植原体
    cotton phyllody, CoP
    布基纳法索
    Burkina Faso
    16SrII-C  EF186827 GU004350 EF186814
    猪屎豆花变叶植原体
    Crotalaria phyllody, CrP
    泰国
    Thailand
    16SrII-C  EF193355 GU004349 EF186818
    大豆花变叶植原体
    soybean phyllody, SOYP
    泰国
    Thailand
    16SrII-C  EF193353 GU004324 EF186816
    刺缘毛莲菜花变叶植原体
    Picris echioides phyllody, PEP
    意大利
    Italy
    16SrII-E  Y16393 GU004348 EF193381
    桃黄化植原体
    peach X-disease,CX
    加拿大
    Canada
    16SrIII-A  L33733 GU004327 EF186813
    三叶草黄化植原体
    clover yellow edge, CYE
    立陶宛
    Lithuania
    16SrIII-B  AF173558 GU004332 JQ360962
    核桃丛枝植原体
    walnut witches’-broom, WWB
    美国乔治亚州
    Georgia, USA
    16SrIII-G  AF190227 GU004325 JQ360961
    榆树黄化植原体
    elm yellows, ‘Ca.P.ulmi’EYEu (EY-626、EY-627)
    意大利
    Italy
    16SrV-A  AY197657 AY197691 AY197678
    悬钩子矮化植原体
    rubus stunt, RUS
    意大利
    Italy
    16SrV-E  AY197648 AY197696 AY197668
    马铃薯丛枝植原体
    potato witches’-broom, ‘Ca.P.trifolli’PWB
    加拿大
    Canada
    16SrVI-A  AY500818 GU004316 AY197683
    白蜡木黄化植原体
    ash yellows, AshY1
    美国纽约
    New York, USA
    16SrVII-A  AF092209 GU004329 EF183492
    欧洲核果黄化/李子坏死植原体
    European stone fruit yellows/ plum, ‘Ca.P. prunorum’PLN
    德国/意大利
    Germany/Italy
    16SrX-B  AJ542545 GU004334 EF193369
    绣球花花变叶植原体
    hydrangea phyllody, HYDP
    比利时
    Belgium
    16SrI-A  AY265215 AY803181 AY264868
    报春花花变绿植原体
    primrose virescence, PRIVC
    德国
    Germany
    16SrI-B  AY265210 AY803176 AY264854
    三叶草花变叶植原体
    clover phyllody, CPh
    加拿大
    Canada
    16SrI-C  AF222065 AY803179 AY264862
    蓝莓矮化植原体
    blueberry stunt, BBS3
    美国
    USA
    16SrI-E  AY265213 GU004357 AY264863
    下载: 导出CSV 
    | 显示表格

    分别通过生物信息学在线分析网站ProtParam (http://web.expasy.org/protparam/)、Protscale (https://web.expasy.org/protscale/)、TMHMM (http://www.cbs.dtu.dk/services/TMHMM-2.0/)和SignalP (http://www.cbs.dtu.dk/ services/SignalP/)对secY基因编码的蛋白特性、蛋白亲疏水性、蛋白跨膜结构区和信号肽进行分析。

    图1所示:感病小驳骨植株严重矮化,节间明显缩短,侧芽细弱,枝条丛生成簇状,叶片小而黄。

    图  1  云南元谋小驳骨丛枝病症状
    Figure  1.  The symptom of G. vulgaris Nees witches’-broom disease of Yuanmou County, Yunnan Province

    小驳骨感病植株总DNA经PCR扩增,均得到大小与阳性对照一致的特异性条带,而双蒸水和健康植株总DNA均未扩增出特异性条带。测序结果表明:从小驳骨感病植株样品总DNA中分别扩增得到了1248 bp的16S rRNA基因片段(nested PCR) (MN535183)、1171 bp的rp基因片段(MN543078)及1425 bp的secY基因片段(MN543069),这与预期扩增片段长度相符。由此将该植原体株系命名为云南元谋小驳骨丛枝植原体(Gendarussa vulgaris witches’-broom phytoplasma,GvWB-YNym)。

    (1) 16S rRNA基因序列分析

    经BLAST搜索,显示GvWB-YNym的16S rRNA基因序列与16SrII-A亚组为最佳匹配同源序列。经MUSCLE进行在线比对结果(表3)所示:该序列片段与16SrII-A亚组的番茄巨芽植原体(Tomato big bud,TBB-YM,GenBank 登录号:JQ923436)的相似率高达100.00%。由图2所示:GvWB-YNym与植原体16SrII组明显聚为一枝,且又与归属为16SrII-A亚组的番茄巨芽植原体(Tomato big bud,TBB-YM,GenBank 登录号:JQ923436)及来自云南元谋的菊苣丛枝植原体(‘Cichorium intybus’ witches’-broom,CiWB-YNym,GenBank 登录号:KJ735774)处于同一枝。

    表  3  小驳骨丛枝植原体(GvWB-YNym)16S rRNArpsecY基因核苷酸序列与部分16SrII亚组株系的同源性分析
    Table  3.  Homology analysis of nucleotide sequences between GvWB-YNym 16S rRNA, rp and secY gene with other phytoplasma strains of 16SrII subgroup
    植原体菌株
    phytoplasma strains
    亚组
    subgroup
    GenBank登录号 GenBank accession No. 核苷酸同源性/% nucleotide homologous
    16S rRNAsecYrp16S rRNAsecYrp
    TBB-YM/ TBBP-YNym 16SrII-A JQ923436 KC953016 KC953010 100.00 99.93 99.83
    PnWB 16SrII-A L33765 GU004331 EF193375 99.60 99.79 99.74
    TWB-YNym 16SrII-A KC953005 KC953017 KC953011 99.68 99.86 100.00
    BgWB 16SrII-A AB690304 AB703249 AB703243 99.68 100.00 99.91
    CuPh 16SrII-A KY349111 KY365527 KY365523 99.44 99.84 99.82
    CoP 16SrII-C EF186827 GU004350 EF186814 98.08 88.43 90.76
    CrP 16SrII-C EF193355 GU004349 EF186818 98.00 88.25 90.51
    SOYP 16SrII-C EF193353 GU004324 EF186816 98.00 87.44 90.60
    PEP 16SrII-E Y16393 GU004348 EF193381 98.08 88.23 90.26
    下载: 导出CSV 
    | 显示表格
    图  2  基于16S rRNArpsecY基因序列构建的GvWB-YNym系统进化树
    Figure  2.  Phylogenetic trees based on 16S rRNA, rp and secY gene sequences from GvWB-YNym and related phytoplasma strains

    (2) rp基因序列的分析

    将测序所得的rp基因序列提交到NCBI网站ORF Finder进行在线分析,分析结果表明:rp序列包含了rps3 (nt550-1170)基因部分序列和rpl22 (nt90-476)基因全部序列,分别编码了206和128个氨基酸。由表3所示:该序列与16SrII-A亚组各株系相似率均高于99.74%,且与16SrII-A亚组中的番茄丛枝(TWB-YNym)相似率高达100%。由图2所示:GvWB-YNym与16SrII-A亚组同处1个分枝簇上,且与16SrII组聚为一大进化枝,这与基于16S rRNA基因序列构建的系统发育树具有相近之处,表明植原体类群之间具有相似的关联性。因此,依据rp基因序列可将GvWB-YNym归为16SrII-A亚组。

    (3) secY基因序列的分析

    secY基因序列提交至NCBI网站ORF Finder进行在线分析,结果显示:secY基因序列包含了整个secY基因(nt74-1336),编码了420个氨基酸。由表3所示:GvWB-YNym与植原体16SrII-A亚组中的5个植原体相似率达99.79%以上,与16SrII-A亚组中的印度黑豆丛枝(BgWB)相似率达到100%。由图2所示:secY基因与16SrII-A亚组的各个成员共同聚为一群,而与16SrII组其他亚组及其他外组亲缘关系相对较远;这也与基于rp基因和16S rRNA基因构建的系统发育树显示出相似的主次分枝顺序。据此结果推断,将GvWB-YNym划分为16SrII-A亚组。

    iPhyClassifier在线分类鉴定结果显示:该株系16S rRNA基因序列与16SrII-A亚组代表性植原体花生丛枝植原体株系(L33765)相似性最高,相似系数高达1.00,且二者间的16S rDNA F2n/R2序列片段模拟RFLP图谱完全一致,上述所有分类结果均显示GvWB-YNym归属为16SrⅡ-A亚组。同时,在线分析还显示:GvWB-YNym与候选种‘Candidatus Phytoplasma aurantifolia’(U15442)同源性最高,达98.2%,因此可确定GvWB-YNym候选种与‘Ca.Phytoplasma aurantifolia’相关。

    经分析工具ProtParam对GvWB-YNym的secY蛋白理化特性进行分析,结果显示其编码了420个氨基酸,分子量为47 720.21 u,理论等电点9.68,脂肪系数为136.45,不稳定系数31.94,属于稳定蛋白,总平均亲水性数值为0.664,表明该蛋白疏水性较好,属疏水性蛋白。通过在线分析网站Protscale对secY蛋白亲疏水性作进一步分析,结果如图3所示。从整体来看,该蛋白疏水氨基酸(正值)多于亲水氨基酸(负值),表现为疏水性,与物理特性预测结果一致;其在215和216位氨基酸疏水性分值最高(3.661),疏水性最强;在238和239位氨基酸亲水性分值最低(−2.678),亲水性最强。

    图  3  secY蛋白亲疏水性分析
    注:从左到右横向为氨基酸序列顺序;零水平线上方为疏水位点;零水平线下方为亲水位点。
    Figure  3.  Hydrophilic analysis of secY protein
    Notes: The horizontal direction is the amino acid sequence from left to right; the hydrophobic level is above the zero horizontal line; the hydrophilic position is below the zero horizontal line.

    以在线跨膜结构区预测软件TMHMM分析secY蛋白的跨膜域,结果(图4a)显示:该蛋白氨基酸序列具有10个显著且分布相对均匀的跨膜螺旋区域,表明该蛋白可能定位于细胞中与膜相关的结构,属于跨膜蛋白。信号肽是负责把蛋白引导到不同膜结构的亚细胞器内的短肽链,通过SignalP在线分析工具对secY基因进行信号肽分析,分析结果如图4b所示:GvWB-YNym的secY蛋白不存在信号肽。

    图  4  secY蛋白跨膜结构及信号肽分析
    注:a) secY蛋白跨膜结构预测;b) secY蛋白信号肽预测,C-score. 原始剪切位点的分值,S-score. 信号肽的分值,Y-score. 综合剪切位点的分值。
    Figure  4.  TMHMM posterior probabilities and prediction of the signal peptide of secY protein
    Notes: a) membrane localization prediction; b) signal peptide prediction, C-score. original cut score, S-score. signal score, Y-score. general score.

    由于植原体难以体外培养,多方面研究均落后于其他细菌,目前植原体的分类鉴定及其亲缘进化关系的研究领域仍然是热点。高度保守的16S rRNA基因序列常被用作植原体的系统发育进化关系及分类鉴定遗传标记[5]。随着计算机技术及网络系统的加速发展和日渐成熟完善,16S rRNA基因的虚拟RFLP图谱分析在植原体快速分类鉴定以及流行病学研究的分类学中越来越重要[16]。根据IRPCM (2004)规定[17]16S rRNA基因序列与现有序列间的同源性大于97.5%时可被认为是相同组的植原体。然而,基于植原体中高度保守的16S rRNA基因序列的2.5%不同的任意阈值对植原体株系进行分组的依据,不能满足16S rRNA基因序列同源性虽大于97.5%但在植物寄主范围和介体昆虫等方面具有独特生态学和生物学的植原体株系进行分类的要求。因此,为了能在分子水平上更准确地区分植原体株系,便需要引入额外的分子标记。而作为辅助分类的其他遗传标记如核糖体蛋白(rp)基因、secYtuf23S rRNA基因以及16S-23S rRNA基因间隔区序列已被广泛应用。

    比较分析给定的PnWB组(16SrII)各亚组之间的同源性发现:secY基因的序列相似性变化范围最大,其次为rp基因和16S rRNA基因;GvWB-YNym与16SrII-A亚组的亲缘关系最为接近,16S rRNArp基因序列在16SrII-A亚组各株系上表现出高相似性,但rpsecY基因序列比16S rRNA基因序列能够呈现出更大的遗传变异性,而secY基因相较于rp基因的序列又具有更大的可变程度,这些信息能够极大地增强对植原体组内遗传进化关系密切但不同亚组的分类鉴定能力,且与前人的研究[12, 18-22]具有一致性。通过基于16S rRNArpsecY基因构建的系统发育进化树分析,也能够支持这一论断。根据16S rRNArpsecY基因序列构建的系统发育进化树,都显示GvWB-YNym与16SrII-A亚组的各植原体株系形成单系群,且与其他16SrII组植原体聚为一大亚枝,但与16SrII组外的其他亚组植原体明显划分为不同进化枝。这3个系统进化树分析能够显著区分开植原体株系组与亚组之间的关系,进一步证实了以rpsecY基因作为分类辅助标记的可信度和重要性,是对利用16S rRNA基因对植原体进行分类的补充依据,也表明了GvWB-YNym归属到16SrII-A亚组的准确性。然而,分别基于16S rRNArpsecY基因构建的系统进化树中的各个分枝顺序并不完全一致,表明16S rRNArpsecY基因在其各自的进化史上遗传变异程度的不一致性。16S rDNA序列的RFLP分析代表不同的系统发育谱系,依据植原体在线分类网站iPhyClassifier对GvWB-YNym进行快速分类,结果表明GvWB-YNym与候选种‘Ca.Phytoplasma aurantifolia’相关,且与16SrII-A亚组代表性植原体株系花生丛枝植原体(L33765)的16S rDNA F2n/R2序列片段模拟RFLP图谱完全一致,进一步证实了将GvWB-YNym归属为16SrII-A亚组分类地位的准确性。这是小驳骨丛枝植原体的首次报道。

    原核生物细胞的生长和发育依赖于Sec分泌蛋白转运机制,多数分泌蛋白和整合膜蛋白都需要经由此途径进行转运,其中起重要作用的是膜蛋白三聚体SecYEG和动力蛋白secA。在Sec转运酶中,secY、secE、secG和secA构成作为细胞质膜的输出机制中的转位酶复合物,secA、secE和secY是蛋白质易位和细胞活力必不可少的部分。在蛋白转运过程中,前体蛋白经由secA携带的伴胞分子的引导,同时利用ATP酶的水解活性促进该蛋白质穿过三聚体SecYEG形成的跨膜通道到达膜外[23]。植原体有2个分泌系统,YidC和Sec,后者几乎是绝大多数或所有植原体的共同分泌系统,KAKIZAWA等[24]发现:植原体中存在Sec系统,而secA和secY蛋白是其中重要组成部分,但其并不清楚Sec系统在植原体中的作用机制。岳红妮等[25]研究发现:泡桐丛枝(PaWB)植原体中同样存在的Sec分泌蛋白转运系统,并猜测该系统可能会直接将细菌蛋白质如毒素等转运到宿主细胞质或寄主昆虫细胞中,从而诱发宿主病症。本研究通过对secY蛋白进行生物信息参数的分析发现:该蛋白作为疏水性稳定跨膜蛋白存在于感病小驳骨植株中;secY蛋白含10个显著疏水跨膜区域,与大肠杆菌中的secY蛋白具有相似的跨膜结构区[26],这种膜包埋的结构可赋予secY蛋白“转运蛋白”功能,为膜蛋白的分泌提供通道,但secY蛋白中不存在信号肽。由于植原体缺乏细胞壁,其细胞膜可直接与寄主植物的细胞内环境进行接触,一些与致病性相关的致病因子可能通过Sec转运系统直接释放到宿主细胞中,导致植株韧皮部功能受损,从而诱发寄主产生抗病性,影响植物的防御响应,进而直接或间接地导致寄主植物或介体昆虫发生互作,诱使寄主植物发生典型植原体病害症状。但secY蛋白在植原体内转运机制中扮演的具体角色尚不明确,还有待进一步研究和证实,本研究将为了解Sec转运系统在植原体的分子致病机制及防治植原体病害上提供更大的帮助。

    本研究是首次对小驳骨丛枝植原体病害的相关报道,明确了小驳骨丛枝病是由植原体所侵染发生的,确定了该植原体株系16S rII-A亚组的分类地位;同时对secY蛋白在Sec分泌蛋白转运系统中的作用进行了初步探讨,为了解Sec转运系统在植原体的分子致病机理及防治此类病害提供帮助

  • 图  1   转录本与独立基因拼接长度和频数分布

    Figure  1.   Distribution of splice length and frequency of transcripts and unigene

    图  2   基于NR数据库比对的同源基因物种来源分布

    Figure  2.   Species distribution of the top BLASTx hits against the NR database for unigene in H. nipponia

    图  3   日本医蛭GO分类

    注:1. 生物相;2. 单有机体过程;3. 多有机体过程;4. 生长;5. 移动;6. 生物正调控过程;7. 发育过程;8. 组织或生物源的细胞组分;9. 节奏进程;10. 细胞过程;11. 新陈代谢过程;12. 信号;13. 细胞聚集;14. 免疫反应过程;15. 生物黏附;16. 生殖过程;17. 生物负调控过程;18. 行为;19. 多细胞生物体过程;20. 生物调节;21. 解毒;22. 生殖;23. 刺激反应;24. 生物过程调控;25. 定位;26. 细胞杀伤;27. 病毒部分;28. 细胞外区域;29. 突触成分;30. 其他有机体;31. 细胞;32. 细胞器;33. 突触;34. 细胞结合;35. 膜包围的内腔;36. 细胞膜成分;37. 细胞成分;38. 细胞外基质;39. 其他有机体成分;40. 病毒;41. 细胞外区域成分;42. 细胞外基质成分;43. 大分子聚合物;44. 细胞膜;45. 内核;46. 细胞器成分;47. 分子传导活力;48. 催化活性;49. 连接功能;50. 载体活性;51. 金属伴侣活性;52. 转录因子活性,蛋白质结合;53. 分子功能调节;54. 抗氧化活性;55. 结构分子活力;56. 核苷酸连接转录因子活性。

    Figure  3.   GO classification

    Note:1. biological phase; 2. single-organism process; 3. multi-organism process; 4. growth; 5. locomotion; 6. positive regulation of biological process; 7. developmental process; 8. cellular component organization or biogenesis; 9. rhythmic process; 10. cellular process; 11. metabolic process; 12. signaling; 13. cell aggregation; 14. immune system process; 15. biological adhesion; 16. reproductive process; 17. negative regulation of biological process; 18. behavior; 19. multicellular organismal process; 20. biological regulation; 21. detoxification; 22. reproduction; 23. response to stimulus; 24. regulation of biological process; 25. localization; 26. cell killing; 27. virion part; 28. extracellular region; 29. synapse part; 30. other organism; 31. cell; 32. organelle; 33. synapse; 34. cell junction; 35. membrane-enclosed lumen; 36. membrane part; 37. cell part; 38. extracellular matrix; 39. other organism part; 40. virion; 41. extracellular region part; 42. extracellular matrix component; 43. macromolecular complex; 44. membrane; 45. nucleoid; 46. organelle part; 47. molecular transducer activity; 48. catalytic activity; 49. binding; 50. transporter activity; 51. metallochaperone activity; 52. transcription factor activity, protein binding; 53. molecular function regulator; 54. antioxidant activity; 55. structural molecule activity; 56. nucleic acid binding transcription factor activity.

    图  4   日本医蛭KOG分类

    Figure  4.   KOG classification

    图  5   日本医蛭的KEGG分类

    Figure  5.   KEGG classification

    图  6   SSR重复单元

    Figure  6.   SSR motif unit

    图  7   日本医蛭重复基元种类分布

    Figure  7.   Types and distribution of SSRs

    图  8   日本医蛭不同组织相关基因表达热图

    Figure  8.   Heat map of gene expression in different tissues of H. nipponia

    表  1   不同温度下日本医蛭各组织测序数据统计

    Table  1   Statistical data of RNA-seq for H. nipponia at different temperatures

    样本 samples原始数据 raw reads清洁数据 clean reads碱基数量/G clean bases错误率/% errorQ20/%Q30/%GC百分比/% GC percent
    H24_145 431 08044 676 7746.700.0397.5092.5841.88
    H24_245 719 00444 872 1646.730.0397.3092.1441.71
    H24_347 655 93246 815 8007.020.0397.2892.1143.10
    C24_145 996 73045 117 4046.770.0397.2392.0142.27
    C24_251 090 89449 760 0107.460.0397.3292.2342.28
    C24_347 917 68246 952 3107.040.0397.4792.5242.43
    M24_150 189 63849 072 6167.360.0397.4892.5442.73
    M24_247 912 72847 118 0087.070.0397.3392.2042.49
    M24_347 104 41845 704 9486.860.0397.3792.3743.34
    H18_148 066 69447 299 2247.090.0397.2492.0341.95
    H18_246 001 15045 192 3826.780.0397.3292.2542.16
    H18_346 693 84045 834 8046.880.0397.2692.1042.20
    C18_145 453 33044 652 9106.700.0397.2992.1042.89
    C18_248 072 83047 297 1667.090.0397.3692.2742.95
    C18_346 965 37445 732 2306.860.0397.5192.6042.65
    M18_147 919 80446 592 2066.990.0397.4192.4241.69
    M18_246 058 13045 030 1826.750.0397.4092.3842.28
    M18_347 057 39246 211 3606.930.0397.3992.3442.28
    下载: 导出CSV

    表  2   拼接转录本长度分布

    Table  2   Distribution of number and quality of unigenes and transcripts

    项目
    item
    最小长度/bp
    Min. length
    平均长度/bp
    mean length
    最大长度/bp
    Max. length
    N50总条数
    N50 total number
    N90总条数
    N90 total number
    总条数
    total number
    总核苷酸/nt
    total nucleotides
    独立基因 unigenes3011 39030 8532 48352052 20672 566 318
    转录本 transcripts3011 82630 8532 894820202 570369 978 282
    下载: 导出CSV

    表  3   日本医蛭独立基因注释数量统计

    Table  3   The statistical number of unigene that were functional annotated in H. nipponia

    数据库
    database
    非重复序列基因数
    number of unigene
    比例/%
    percentage
    NR 21 967 42.07
    NT 6 379 12.21
    KO 6 408 12.27
    SwissProt 16 852 32.27
    Pfam 22 984 44.02
    GO 22 984 44.02
    KOG 9 849 18.86
    能被所有数据库注释数目
    annotated in all databases
    1 705 3.26
    至少被1个数据库注释数目
    annotated in at least one database
    29 352 56.22
    总独立基因数目
    total unigene
    52 206 100
    下载: 导出CSV

    表  4   日本医蛭SSR不同核苷酸重复基元的类型及频率

    Table  4   Types and frequencies of different nucleotide repeat motifs of SSR in H. nipponia

    重复基元类型
    repeat motif length
    重复次数
    repeat number
    总计
    total
    频数/%
    frequency
    5678910>10
    A/T 2 490 1 765 4 255 14.22
    C/G 115 149 264 0.88
    AC/GT 112 47 28 22 12 37 258 0.86
    AG/CT 84 40 29 17 18 55 243 0.81
    AT/AT 239 150 104 57 34 83 667 2.23
    AAC/GTT 1 315 705 405 213 196 109 139 3 082 10.30
    AAT/ATT 2 485 1 201 766 536 777 507 803 7 075 23.64
    ATC/ATG 3 935 2 139 1 248 745 579 397 453 9 496 31.73
    AAAT/ATTT 221 68 35 5 1 3 5 338 1.13
    AATG/ATTC 110 54 67 10 2 1 34 278 0.93
    ATCC/ATGG 199 126 159 34 9 20 115 662 2.21
    AAAAT/ATTTT 6 3 9 0.03
    AACAT/ATGTT 7 2 1 10 0.03
    AATAT/ATATT 8 1 1 1 4 15 0.05
    AATGAT/ATCATT 4 1 1 6 0.02
    ACCATC/ATGGTG 3 1 1 1 6 0.02
    ACGATG/ATCGTC 50 4 4 10 3 3 1 75 0.25
    总计 total 8 343 4 739 2 922 1 714 1 664 3 712 3 645 26 739 89.35
    频数/% frequency 82.88 87.08 88.81 91.61 95.52 98.86 96.97 89.35
    下载: 导出CSV

    表  5   差异表达基因数

    Table  5   Number of differentially expressed genes

    组织
    tissue
    差异表达基因
    all DEGs
    下调基因
    down-regulated genes
    上调基因
    up-regulated genes
    H18 vs H24 434 223 211
    C18 vs C24 591 400 191
    M18 vs M24 578 216 362
    下载: 导出CSV
  • [1] 杨潼. 中国动物志, 环节动物门, 蛭纲[M]. 北京: 科学出版社, 1996.
    [2] 余米, 刘嘉, 周梦, 等. 日本医蛭生境水质及生物学特性初探[J]. 中药材, 2019, 42(12): 2782. DOI: 10.13863/j.issn1001-4454.2019.12.009.
    [3]

    LIU Z C, ZHAO F, TONG X R, et al. Comparative transcriptomic analysis reveals the mechanism of leech environmental adaptation[J]. Gene, 2018, 664: 70. DOI: 10.1016/j.gene.2018.04.063.

    [4]

    KHAN M S, GUAN D, KVIST S, et al. Transcriptomics and differential gene expression in Whitmania pigra (Annelida: Clitellata: Hirudinida: Hirudinidae): contrasting feeding and fasting modes[J]. Ecology and Evolution, 2019, 9(8): 4706. DOI: 10.1002/ece3.5074.

    [5] 邢月婷, 管峰, 李诗语, 等. 日本医蛭唾液腺对饥饿胁迫响应的转录组比较[J]. 水产学报, 2020, 44(5): 754.
    [6]

    GRABHERR M G, HAAS B J, YASSOUR M, et al. Full-length transcriptome assembly from RNA-Seq data without a reference genome[J]. Nature Biotechnology, 2011, 29(7): 644. DOI: 10.1038/nbt.1883.

    [7]

    ALTSCHUL S F, MADDEN T L, Schaffer A A, et al. Gapped BLAST and PSI-BLAST: a new generation of protein database search programs[J]. Nucleic Acids Research, 1997, 25(17): 3389. DOI: 10.1093/nar/25.17.3389.

    [8]

    MORIYA Y, ITOH M, OKUDA S, et al. KAAS: an automatic genome annotation and pathway reconstruction server[J]. Nucleic Acids Research, 2007, 35: 182. DOI: 10.1093/nar/gkm321.

    [9]

    FINN R D, TATE J, MISTRY J, et al. The Pfam protein families database[J]. Nucleic Acids Research, 2008, 36: 281. DOI: 10.1093/nar/gkh121.

    [10]

    GOTZ S, GARCIAGOMEZ J M, TEROL J, et al. High-throughput functional annotation and data mining with the Blast2GO suite[J]. Nucleic Acids Research, 2008, 36(10): 3420. DOI: 10.1093/nar/gkn176.

    [11]

    LI B, DEWEY C N. RSEM: accurate transcript quantification from RNA-Seq data with or without a reference genome[J]. BMC Bioinformatics, 2011, 12(1): 323. DOI: 10.1186/1471-2105-12-323.

    [12] 王斌, 孙静, 刘凌云, 等. 蛭类转录组中EST-SSR分析及抗凝血相关分子标记的挖掘[J]. 中草药, 2017, 48(1): 172. DOI: 10.7501/j.issn.0253-2670.2017.01.024.
    [13] 孟玮, 蒋艳琳, 张林, 等. 基于RNA-seq技术的江鳕转录组SSR位点信息分析[J]. 淡水渔业, 2019, 49(6): 10. DOI: 10.13721/j.cnki.dsyy.2019.06.002.
    [14] 陈松波, 龚丽, 刘海金. 牙鲆EST资源的SSR信息分析[J]. 东北农业大学学报, 2010, 41(10): 82. DOI: 10.19720/j.cnki.issn.1005-9369.2010.10.016.
    [15] 刘洪涛, 刘金叶, 杨明秋, 等. 基于转录组测序的波纹唇鱼SSR和SNP多态特征分析[J]. 基因组学与应用生物学, 2020, 39(6): 2451. DOI: 10.13417/j.gab.039.002451.
    [16] 王且鲁, 刘奕, 宋红梅, 等. 双须骨舌鱼转录组EST-SSR标记开发与引物筛选[J]. 淡水渔业, 2016, 46(6): 8. DOI: 10.13721/j.cnki.dsyy.2016.06.002.
    [17]

    FRICKE C, WIGBY S, HOBBS R, et al. The benefits of male ejaculate sex peptide transfer in Drosophila melanogaster[J]. Journal of Evolutionary Biology, 2009, 22(2): 275. DOI: 10.1111/j.1420-9101.2008.01638.x.

    [18]

    WIGBY S, CHAPMAN T. Sex peptide causes mating costs in female Drosophila melanogaster[J]. Current Biology, 2005, 15(4): 316. DOI: 10.1016/j.cub.2005.01.051.

    [19]

    SANDRA G, NORMA M. Sexual determination and differentiation in teleost fish[J]. Reviews in Fish Biology and Fisheries, 2010, 20(1): 101. DOI: 10.1007/s11160-009-9123-4.

    [20]

    HATTORI R S, STRUSSMANN C A, FERNANDINO J I, et al. Genotypic sex determination in teleosts: insights from the testis-determining amhy gene[J]. General and Comparative Endocrinology, 2013, 192: 55. DOI: 10.1016/j.ygcen.2013.03.019.

    [21]

    MARTINEZ P, VINAS A, SANCHEZ L, et al. Genetic architecture of sex determination in fish: applications to sex ratio control in aquaculture[J]. Frontiers in Genetics, 2014, 5: 340. DOI: 10.3389/fgene.2014.00340.

图(8)  /  表(5)
计量
  • 文章访问数: 
  • PDF下载量: 
  • 被引次数: 0
出版历程
  • 通信作者:  曹敏 962103004@qq.com
  • 收稿日期:  2020-04-27
  • 修回日期:  2020-11-12
  • 网络首发日期:  2021-03-30

目录

/

返回文章
返回