扩展功能
文章信息
- 徐春光, 郝永清, 郝瑞霞, 张玲, 刘波
- XU Chun-Guang, HAO Yong-Qing, HAO Rui-Xia, ZHANG Ling, LIU Bo
- 丝状支原体山羊亚种PG3株的全基因组序列测定与分析
- Complete genome sequence and analysis of Mycoplasma mycoides subsp. capri str. PG3
- 微生物学通报, 2017, 44(11): 2669-2678
- Microbiology China, 2017, 44(11): 2669-2678
- DOI: 10.13344/j.microbiol.china.170027
-
文章历史
- 收稿日期: 2017-01-10
- 接受日期: 2017-03-27
- 优先数字出版日期(www.cnki.net): 2017-03-27
2. 内蒙古农业大学兽医学院 微生物学与免疫学实验室 内蒙古 呼和浩特 010018
2. Inner Mongolia Laboratory of Microbiology & Immunology, Veterinary School, Inner Mongolia Agriculture University, Hohhot, Inner Mongolia 010018, China
羊支原体性肺炎(Mycoplasmal pneumonia of sheep and goats,MPSG),又称为羊传染性胸膜肺炎,是由支原体引起的一种高度接触性传染病[1-2]。在畜牧业以羊养殖业为主的不发达国家广泛流行,给各国带来了严重的经济损失[3-5]。国内外研究者认为MPSG的病原复杂,存在多种致病菌型,而丝状支原体山羊亚种(Mycoplasma mycoides subsp. capri,Mmc)是广泛流行于我国很多地区MPSG疾病的优势菌型之一。Mmc的菌体呈球状、棒状、弧状、逗号状、梨状等多种形态,以球状最为常见,比一般支原体大,直径为150-1 250 nm。Mmc营养要求比较苛刻,生长缓慢,在含有血清的固体培养基上形成透明的小菌落,比其他支原体菌落稍大,呈典型的油煎蛋状。PG3株是Mmc的模式株,在1951年由Chu和Berieidege两人分离得到[6]。由Mmc引起的MPSG疾病感染山羊,羔羊易感,一般不感染绵羊。该病在冬末春初和秋季最为常见,Mmc的感染使病羊产生全身多系统综合征,包括胸膜肺炎、关节炎、乳腺炎、结膜炎等[7-8]。羊群一旦感染,感染率和病死率都很高[9],对我国的养羊业造成了严重危害。
药物治疗和疫苗接种是防控该病的主要方法。由于药物治疗的效果不尽如人意,传统疫苗本身具有难以克服的局限,所以人们开始致力于新型药物和疫苗的研制。但是目前几乎没有保护性抗原基因的筛选及其详细的研究报道。过去人们大多从表型分析入手,寻找已知功能的编码基因,实际只了解到极少数的基因,极大地阻碍了对支原体的深入研究。近年来,支原体基因组研究取得了飞速的进展。目前,已经完成95010、GM12和PG3共3株Mmc的基因组测序。完整基因组的序列测定带给研究者有关支原体详尽的遗传学和生物学信息,从根本上揭示微生物的全部基因,不仅可发现新的基因,还可发现新的基因间相互作用、新的调控因子等。这一研究将使人类从更高层次上掌握病原微生物的致病机制及其规律,从而得以发展新的诊断、预防及治疗病原体感染的制剂、疫苗及药品。
1 材料与方法 1.1 材料 1.1.1 菌株及来源: 丝状支原体山羊亚种标准株PG3 (Mycoplasma mycoides subsp. capri str. PG3,Mmc str. PG3)由内蒙古农业大学兽医学院兽医微生物学与免疫学实验室保藏和提供。 1.1.2 培养基、主要试剂和仪器: 改良的Hayflick’s培养基,参照郝瑞霞[10]的方法配制。支原体基因组DNA提取试剂盒,Biomiga公司;Supercoiled DNA Ladder Marker,宝生物工程(大连)有限公司;琼脂糖,Bio-Rad公司。低温高速离心机,Sigma公司;核酸电泳仪,北京百晶生物技术有限公司;UVP凝胶成像系统,Bio-Rad公司;多功能酶标仪,美国伯腾仪器有限公司。 1.2 方法 1.2.1 菌株复苏和扩大培养: 将真空冷冻干燥保存的供试菌株转接至改良的Hayflick’s液体培养基中,在37 ℃、5% CO2和一定湿度的环境下培养5-7 d。以1:6的接种比例再连续传代两次,以便菌株活力得到充分恢复。将复苏后的菌株以1:10的接种比例扩大培养。 1.2.2 基因组DNA的提取: 取扩大培养的菌液,参照支原体基因组DNA提取试剂盒的说明书提取供试菌株的DNA。分光光度法检测提取的DNA样品的浓度与纯度(OD260/OD280)。 1.2.3 基因组测序与注释和分析: 将Mmc str. PG3基因组DNA样品委托深圳华大基因科技有限公司进行全基因组序列测定、基因组注释、共线性分析、非编码RNA (ncRNA)预测和基因岛预测工作。基因组测序。(1)基因组DNA随机文库的构建:将基因组DNA样品用超声波打断,电泳回收主带小于等于800 bp大小的一系列片段,用T4 DNA聚合酶、Klenow DNA聚合酶和T4 PNK将打断形成的粘性末端修复成平末端,再通过3'端加碱基“A”,使得DNA片段能与3'端带有“T”碱基的特殊接头连接,用电泳法选择需回收的目的片段连接产物,再使用PCR技术扩增两端带有接头的DNA片段,以高拷贝的pUC18为载体,构建质粒文库。随后将已加入接头的DNA片段绑定在含有接头的芯片上,经PCR反应,将不同片段扩增。(2)上机测序:采用Illumina公司2010年推出的Illumina HiSeq 2000测序仪进行测序。Illumina HiSeq 2000测序仪采用稳定的可逆终止法边合成边测序技术,使用4种含有末端阻断基团和不同荧光信号的碱基进行模板互补链的合成,不仅确保了测序的高精确性和高顺序性,而且排除了由重复序列和同聚物导致的测序错误。(3)序列拼接:运用SOAPdenovo 1.05短序列组装软件对处理后的reads数据进行组装。该软件通过de Bruijn作图法,拼接相似度大于90%的reads序列。经多次调整后,Mmc str. PG3基因组序列组装主要参数K设置为63,得到最优的组装结果。运用SOAPaligner 2.20序列比对软件把reads比对到组装结果上,统计reads的mapping信息,对组装结果进行补洞、单碱基校对。利用paired-end关系的reads的mapping信息,对组装结果进行局部组装和优化。
基因组注释和分析。采用Glimmer 3.0软件对ORF进行预测,从组装结果中获得基因序列,用于后续的基因功能注释分析。基因预测选择长度大于30个氨基酸的ORF,每个ORF用Blastp在蛋白质序列数据库中搜索蛋白质同源性。比较序列和目标序列达到30%以上的特异性和具有60%以上的同源性序列认为显著相关,对基因名称和功能进行注解。分别采用RNAmmer 1.2和tRNAscan-SE 1.23软件对rRNA和tRNA进行预测,利用Rfam数据库对ncRNA进行预测。用软件MUMmer 3.0和Mauve 1.0对Mmc str. 95010和我们所测的Mmc str. PG3之间进行全基因组序列比对,分析其共线性关系。比对时,以Mmc str. 95010为参照序列,Mmc str. PG3为查询序列。将目标基因组与GI库进行BLAT (Standalone BLAT v. 34)比对,基于该比对结果中的比对长度、GI大小、比对上的GI起止位置等信息来确定目标基因组中可能的GI。将组装结果提交到IS-finder网站上(https://www-is.biotoul.fr/)对IS进行预测分析(使用默认参数),并得出预测结果。
假定可变表面脂蛋白基因的鉴定。(1)同源性和系统发育分析:将Mmc str. PG3的假定可变表面脂蛋白基因序列和其推测的氨基酸序列分别在GenBank数据库中进行BLASTn和BLASTp同源性比对,采用软件DNAMAN V4.1中Neighbor-joining法构建所测基因序列与高同源性序列的系统发育树,分析它们的亲缘关系。(2)基因序列及预测氨基酸序列结构特征:已经有研究证实Mycopalsam mycoides subsp. mycoides Small Colony (MmmSC)的vmm和Mycoplasma capricolum subsp. capricolum (Mcc)的vmc基因编码表达大小和相变异的表面脂蛋白。通过与vmm和vmc基因序列及预测氨基酸序列的结构特征的比较,分析Mmc str. PG3的假定可变表面脂蛋白基因序列。
2 结果与分析 2.1 基因组DNA的提取与检测取2 μL提取的基因组DNA加入0.7%琼脂糖凝胶点样孔中,在120 V电压下电泳30 min,电泳结果见图 1。经分光光度法检测,Mmc str. PG3基因组DNA的浓度为2 440 mg/L,纯度OD260/OD280为1.81,达到基因组DNA测序要求。
2.2 Mmc str. PG3基因组注释和分析 2.2.1 Mmc str. PG3基因组序列基本信息: K-mer频率分布显示Mmc str. PG3预测基因组大小为1.02 Mb,错误率为0.001 2。GC-depth分析呈泊松分布,G+C%不存在偏移。SOAPdenovo 1.05对Mmc str. PG3基因组测序所得reads数据进行组装后得到22个Contig,9个Scaffold,N50和N90长度分别为644 622 bp和76 924 bp。基因组大小为1 025 065 bp,G+C%为23.6%,含有3个rRNA (1个5S rRNA,1个16S rRNA,1个23S rRNA),28个tRNA,12个sRNA,分析预测基因数为846个,编码区大小为869 436 bp,基因平均长度为1 027 bp,运用SIGI-HMM软件在基因组上未检测到GI。该菌株不存在IS或者ICE序列。DDBJ/EMBL/GenBank accession ANIV00000000。如表 1所示,Mmc str. PG3整个基因组的大小、G+C%含量和编码基因的数量均小于其他3株已完成基因组测序的Mmc,只有Mmc str. 95010具有质粒,其他3株包括Mmc str. PG3没有发现质粒。菌株 Strain |
染色体 Chromosome |
质粒 Plasmids |
大小 Size (Mb) |
G+C%含量 G+C% |
编码基因数量 Number of gene (coding) |
95010 | 1 | 1 | 1.16 | 23.8 | 924 |
GM12 | 1 | - | 1.09 | 23.9 | 911 |
GM12 | 1 | - | 1.08 | 23.9 | 908 |
PG3 | 1 | - | 1.02 | 23.6 | 846 |
2.2.4 基因组共线性分析: 将全基因组序列与已公布的Mmc str. 95010的基因组进行比对,以揭示二者的亲缘关系远近。比对的结果见图 5和6,从比对结果可以看出二者存在大量的相同序列,并且保持着良好的线性关系,没有发生过大规模的插入、缺失、倒位等现象。Mmc str. PG3和Mmc str. 95010很有可能是近期分化的,亲缘关系较近。这将有助于对Mmc引起的MPSG的流行病学的研究。
2.2.5 Mmc str. PG3三个可变表面脂蛋白基因的鉴定: 将Mmc str. PG3的GL000459、GL000461和GL000462三个基因的氨基酸序列在蛋白质序列数据库中搜索,发现与Mmc str. GM12的可变表面脂蛋白VlcF同源性最高,推测具有相似的功能,因此将这3个基因预测为编码可变表面脂蛋白的基因。(1)可变表面脂蛋白基因序列的同源性分析:将可变表面脂蛋白基因序列GL000459、GL000461和GL000462与GenBank数据库的已知序列进行BLAST比对,同源性分析结果显示这3个基因序列与Mm Cluster中除了MCCP外的所有成员(Mmc、Mcc、ML和MmmSC)的可变表面脂蛋白基因序列具有亲缘关系。Mmc str. PG3可变表面脂蛋白基因序列和预测的氨基酸序列与Mmc str. GM12的可变脂蛋白基因序列MMCAP2_0900和Mmc str. GM12的可变脂蛋白氨基酸序列相似性最高,为95%和91%。(2)可变表面脂蛋白基因序列及预测氨基酸序列结构特征:Mmc str. PG3可变表面脂蛋白基因GL000459、GL000461和GL000462在基因组中呈串联连续排列,基因序列高度同源,它们的ORF分别由417、624和684个bp组成。GL000459基因上游具有典型原核生物的启动子结构,与vmm基因的启动子结构高度保守,由-35区TTGACA盒、-10区TATAAT盒和SD序列(AGGAG)构成,-35区和-10区之间的间隔序列为T(TA)8,共17个核苷酸;GL000461和GL000462基因的启动子高度保守,但没有典型的-10区TATAAT盒和SD序列(AGGAG),在-35区和-10区之间均具有T(TA)n–2间隔序列,GL000461基因的TA重复10次;由于测序原因,在GL000462基因启动子T(TA)n–2间隔序列与起始密码子之间存在由“N”形成的“洞”,所以只观察到3次TA重复,真实TA重复数未知,见图 7。
Mmc str. PG3可变表面脂蛋白基因GL000459、GL000461和GL000462的前脂蛋白分别由138、207和223个氨基酸组成,其氨基酸序列结构与Mm Cluster中已报道的其他可变表面脂蛋白的氨基酸序列结构高度相似,信号肽与跨膜区和羧基端的部分序列高度保守,而羧基端的可变区通常具有重复序列。这3个前脂蛋白的氨基酸序列结构特征见图 8,GL000459、GL000461的多肽链第20个到第24个氨基酸,GL000462的多肽链第24个到第28个氨基酸,即AVIAC,极可能是前脂蛋白的信号肽酶II的识别序列。前脂蛋白若经酶切裂解后,形成一个信号肽和一个成熟肽序列。
3个多肽链的成熟肽序列都存在短重复序列。BLASTp比对结果显示,Mmc str. PG3前脂蛋白的信号肽与Mmc str. 95010和GM12可变表面脂蛋白家族成员的信号肽的序列相似性为91%-96%,与MmmSC str. PG1的Vmm的信号肽的序列相似性为83%-89%,与Mcc str. California kid的Vmc可变表面脂蛋白家族成员的信号肽的序列相似性为63%-82%,与ML str. PG50和str. 99/014/6的Vlc可变表面脂蛋白家族成员的序列相似性为74%-96%。而前脂蛋白的成熟肽除了与Mmc str. GM12的VlcF (MMCAP2_0900)和95010的两个可变表面脂蛋白(MLC_9030、MLC_9070)的成熟肽区域序列相似性较高外(77%-91%),与其他的可变表面脂蛋白序列相似性均低于50%。由此可见,这个预测的前脂蛋白的信号肽序列保守,成熟肽序列变异较大。
3 结论与讨论我国重庆、贵州和广西等地区均有Mmc引起的山羊传染性胸膜肺炎病例的报道。Mmc的感染导致患病羊萎靡、渐进性消瘦直至死亡,给养殖户造成了巨大的经济损失,严重威胁山羊养殖业发展。目前还不清楚Mmc的致病机制,Mmc引起的山羊传染性胸膜肺炎的防治也亟待解决。但是国内外几乎没有Mmc str. PG3的毒力因子的相关研究报道,为了有效防治羊传染性胸膜肺炎,本研究选择了Mmc str. PG3为目标菌株,对它们的全基因组进行了序列测定和生物信息学分析,寻找抗原性基因作为研制生物工程疫苗的靶基因序列。Mmc str. 95010具有五种类型共24个IS插入序列,两个特异的结合整合元件ICE,每个ICE平均长度为30 kb。并且发现Mmc 95010的多基因家族大多有IS插入序列。这些可移动的遗传因子很大程度地影响基因组的可塑性,导致了大片段DNA的水平转移。在Mmc str. PG3基因组上未检测到GI,该菌株不存在IS或者ICE序列。在Mm Cluster其他成员包括Mmc str. GM12中未发现这两个ICE。由此可见,只能通过比较基因组的手段来检测Mmc str. PG3是否存在水平基因转移现象。
根据COG分类和KEGG代谢通路分类,Mmc str. PG3基因组中绝大多数基因主要与蛋白翻译、核糖体结构与合成、DNA复制与修复、糖代谢和环境信号传递与转换这几个方面有关。Mmc str. PG3具有Mmc特有的麦芽糊精/麦芽糖代谢途径,提示Mmc可能利用麦芽糊精和麦芽糖,而Mm Cluster中其他亚种未发现编码麦芽糊精/麦芽糖代谢途径相关酶类的麦芽糊精/麦芽糖基因簇,为Mmc的病原检测和培养基的改良提供了新思路。
研究者们认为支原体在感染的不同阶段通过表面可变蛋白加强定殖和适应宿主的组织环境。可变表面脂蛋白对于支原体的抗原性、免疫调节和底物结合等有着重要的意义[11-12]。在Mmc str. PG3基因组中预测到3个连续排列的可变表面脂蛋白基因,按照在基因组中的位置命名为GL000459、GL000461和GL000462。由于测序原因,在GL000459和GL000461之间存在由几百个bp的“N”形成的“洞”,生物信息学分析认为这是基因GL000460。可变表面脂蛋白基因一般在基因组中呈串联连续分布,在Mmc str. PG3可变表面脂蛋白基因簇的相应位置能够找到可变表面脂蛋白基因,推测GL000460是Mmc str. PG3可变表面脂蛋白基因簇的一个成员。这3个可变表面脂蛋白基因序列和预测的氨基酸序列与Mm Cluster中可变表面脂蛋白基因家族其他成员具有较高的同源性,这些蛋白的氨基端的信号肽与跨膜区和羧基端的部分序列高度保守,而羧基端的可变区具有重复序列。其中的一个可变表面脂蛋白基因(GL000459)与之前研究的假定可变表面脂蛋白基因(GenBank登录号:KC170277)[13]是同一个基因。在进化的过程中发生了由于重复序列的缺失或插入产生的变异现象,病原菌可能是通过这种变异逃避宿主的免疫清除而实现对宿主的致病作用。
[1] |
Kusiluka LJ, Ojeniyi B, Friis NF, et al. Mycoplasmas isolated from the respiratory tract of cattle and goats in Tanzania[J]. Acta Veterinaria Scandinavica, 2000, 41(3): 299-309. |
[2] |
Carmichael LE, George TD, Sullivan ND, et al. Isolation, propagation, and characterization studies of an ovine mycoplasma responsible for proliferative interstitial pneumonia[J]. Cornell Veterinairian, 1972, 62(4): 654-679. |
[3] |
Martrenchar A, Bouchel D, Zoyem N. Isolation and experimental studies of Mycoplasma mycoides subsp. mycoides LC and Mycoplasma ovipneumoniae in goats in Northern Cameroon[J]. Small Ruminant Research, 1995, 16(2): 179-184. DOI:10.1016/0921-4488(95)00621-Q |
[4] |
Ojo MO. Caprine pneumonia in Nigeria. I. Epidemiology and bacterial flora of normal and diseased respiratory tracts[J]. Tropical Animal Health and Production, 1976, 8(2): 85-89. |
[5] |
Villalba EJ, poveda JB, Femández A, et al. An outbreak caused by Mycoplasma mycoides species in goats in the Canary Islands[J]. The Veterinary Record, 1992, 130(15): 330-331. DOI:10.1136/vr.130.15.330 |
[6] |
Edward DG. The pleuropneumonia group of organisms: a review, together with some new observations[J]. Journal of General Microbiology, 1954, 10(1): 27-64. DOI:10.1099/00221287-10-1-27 |
[7] |
Alley MR, Clarke JK. The experimental transmission of ovine chronic non-progressive pneumonia[J]. New Zealand Veterinary Journal, 1979, 27(10): 217-220. DOI:10.1080/00480169.1979.34653 |
[8] |
Chu YF. An etiological and epidemiological study on contagious caprine pleuropneumoniae in China and development of a bacterin against it[D]. Beijing: Doctoral Dissertation of China Academy of Agricultural Sciences, 2011 (in Chinese) 储岳峰. 我国山羊(接触)传染性胸膜肺炎病原学、流行病学研究及灭活疫苗的研制[D]. 北京: 中国农业科学院博士学位论文, 2011 |
[9] |
Deng GM, Zhao X, Liang GX, et al. Diagnosis and control of contagious caprine pleuropneumoniae-like[J]. Chinese Veterinary Science, 1991, 21(6): 3-6. 邓光明, 赵煊, 梁桂香, 等. 类山羊传染性胸膜肺炎诊断和防治的研究——病原诊断[J]. 中国兽医科技, 1991, 21(6): 3-6. |
[10] |
Hao RX. Isolation identification of Mycoplasma ovipneumoniae and genomic sequence determination and analysis[D]. Hohhot: Master's Thesis of Inner Mongolia Agriculture University, 2012 (in Chinese) 郝瑞霞. 绵羊肺炎支原体的分离鉴定及全基因组序列的测定和分析[D]. 呼和浩特: 内蒙古农业大学硕士学位论文, 2012 |
[11] |
Browning GF, Marenda MS, Noormohammadi AH, et al. The central role of lipoproteins in the pathogenesis of mycoplasmoses[J]. Veterinary Microbiology, 2011, 153(1/2): 44-50. |
[12] |
Ni B, Bai FF, Liu MJ, et al. Research progress on mycoplasma lipoprotein and its variation interaction with host[J]. Biotechnology Bulletin, 2013, 1(2): 49-54. 倪博, 白方方, 刘茂军, 等. 支原体脂蛋白及其变异与宿主互作研究进展[J]. 生物技术通报, 2013, 1(2): 49-54. |
[13] |
Xu CG, Gao MH, Zhao YF, et al. Cloning and prokaryotic expression of putative variable surface lipoprotein gene of Mycoplasma mycoides subsp. capri str. PG3[J]. Progress in Veterinary Medicine, 2013, 34(5): 36-43. 徐春光, 高明华, 赵艳芳, 等. 丝状支原体山羊亚种假定可变表面脂蛋白基因的克隆及原核表达[J]. 动物医学进展, 2013, 34(5): 36-43. |