生物工程学报  2018, Vol. 34 Issue (1): 122-131
http://dx.doi.org/10.13345/j.cjb.170114
中国科学院微生物研究所、中国微生物学会主办
0

文章信息

高波, 沈丹, 陈才, 王赛赛, 杨昆仑, 陈伟, 王伟, 张丽, 宋成义
Gao Bo, Shen Dan, Chen Cai, Wang Saisai, Yang Kunlun, Chen Wei, Wang Wei, Zhang Li, Song Chengyi
9种硬骨鱼类转座组注释
Annotation of the mobilomes of nine teleost species
生物工程学报, 2018, 34(1): 122-131
Chinese Journal of Biotechnology, 2018, 34(1): 122-131
10.13345/j.cjb.170114

文章历史

Received: March 24, 2017
Accepted: June 16, 2017
9种硬骨鱼类转座组注释
高波, 沈丹, 陈才, 王赛赛, 杨昆仑, 陈伟, 王伟, 张丽, 宋成义     
扬州大学 动物科学与技术学院,江苏 扬州 225009
收稿日期:2017-03-24; 接收日期:2017-06-16
基金项目:国家自然科学基金(Nos. 31671313,31572364),江苏省高等教育优势学科,扬州市现代农业项目(No. YZ2016040)资助
摘要:通过生物信息学手段对9种硬骨鱼转座组进行注释。结果表明9种硬骨鱼类转座组大小和构成差异显著,其转座组含量从高到低分别为斑马鱼、矛尾鱼、青鳉鱼、罗非鱼、花斑剑尾鱼、大西洋鳕鱼、三刺鱼、金娃娃和红鳍东方鲀,转座子含量和基因组大小呈正相关。DNA转座子在硬骨鱼类中具有多样性高和含量差异大的特点(0.50%-38.37%),是硬骨鱼类转座组差异的主要决定因素,其中hAT和Tc/Mariner超家族是硬骨鱼类主要的DNA转座子。RNA转座子在硬骨鱼类中也具有多样性高的特点,其中LINE转座子占硬骨鱼类基因组的0.53%-5.75%,共检测到14个超家族分布,其中L1、L2、RTE和Rex转座子扩增较为明显,LTR转座子除了在斑马鱼和三刺鱼中含量达到5.58%和2.51%,在大多硬骨鱼类基因组中的含量低于2%,在硬骨鱼类中共检测到6个LTR转座子(Copia、DIRS、ERV、Gypsy、Ngaro和Pao)超家族分布,其中扩增最为明显的是Gypsy。而SINE转座子在硬骨鱼类中扩增最弱,仅在斑马鱼和矛尾鱼中分别达到3.28%和5.64%,在其他7个物种中低于1%。SINE中tRNA、5S和MIR三个超家族在部分硬骨鱼类中有一定程度扩增。本研究表明硬骨鱼类转座组具有多样性丰富、差异大的特点,转座组差异与硬骨鱼基因组大小有很强的相关性,转座组是决定硬骨鱼基因组大小的重要因素。
关键词硬骨鱼     转座子     注释    
Annotation of the mobilomes of nine teleost species
Bo Gao, Dan Shen, Cai Chen, Saisai Wang, Kunlun Yang, Wei Chen, Wei Wang, Li Zhang, Chengyi Song     
College of Animal Science & Technology, Yangzhou University, Yangzhou 225009, Jiangsu, China
Abstract: In this study, the mobilomes of nine teleost species were annotated by bioinformatics methods. Both of the mobilome size and constitute displayed a significant difference in 9 species of teleost fishes. The species of mobilome content ranking from high to low were zebrafish, medaka, tilapia, coelacanth, platyfish, cod, stickleback, tetradon and fugu. Mobilome content and genome size were positively correlated. The DNA transposons displayed higher diversity and larger variation in teleost (0.50% to 38.37%), was a major determinant of differences in teleost mobilomes, and hAT and Tc/Mariner superfamily were the major DNA transposons in teleost. RNA transposons also exhibited high diversity in teleost, LINE transposons accounted for 0.53% to 5.75% teleost genomic sequences, and 14 superfamilies were detected. L1, L2, RTE and Rex retrotransposons obtained significant amplification. While LTR displayed low amplification in most teleost with less than 2% of genome coverages, except in zebrafish and stickleback, where LTR reachs 5.58% and 2.51% of genome coverages respectively. And 6 LTR superfamilies (Copia, DIRS, ERV, Gypsy, Ngaro and Pao) were detected in the teleost, and Gypsy exhibits obvious amplication among them. While the SINE represents the weakest ampification types in teleost, only within zebrafish and coelacanth, it represents 3.28% and 5.64% of genome coverages, in the other 7 teleost, it occupies less than 1% of genomes, and tRNA, 5S and MIR families of SINE have a certain degree of amplification in some teleosts. This study shows that the teleost display high diversity and large variation of mobilome, there is a strong correlation with the size variations of genomes and mobilome contents in teleost, mobilome is an important factor in determining the teleost genome size.
Key words: teleost     transposon     annotation    

转座子是一类具有迁移特性的可移动遗传因子,又称转座因子(Transposable element,TE),属于散在重复序列的一种,也是在染色体上可移位和自主复制的基本单位,其本质是具有不同结构和换位机制的移动基因序列[1]。转座子几乎存在于所有生物基因组中,依据转座机制的不同,可以分为两大类:RNA转座子(Ⅰ类转座子,也称为逆转录转座子)和DNA转座子(Ⅱ类转座子)。RNA转座子通过RNA聚合酶Ⅱ先转录为mRNA,然后在反转录酶的作用下反转录为cDNA,之后再在整合酶的作用下插入到基因组的新位置。这类转座子完成转座后,在其供体位点保留有原始模板。而DNA转座子则是通过“剪切和粘贴”等机制来转座,不通过RNA媒介,具体过程为:在DNA转座酶的作用下,识别DNA转座子侧翼区反向重复序列,直接将转座子供体位点切割,形成突触复合物(Synaptic complex formation,SCF),然后再在转座酶介导下整合到基因组的新位点。转座子根据能否独立行使转座功能,分为自主转座子和非自主转座子。自主转座子一般含有完整的转座酶编码框和必要的转座元件,而非自主转座子一般没有转座酶编码框或者转座酶编码框不完整,非自主转座子可以通过自主转座子的转座酶介导进行转座[1-3]。随着测序技术不断发展,越来越多物种基因组测序完成,对这些基因组注释表明转座子是基因组进化的重要因素,影响基因组大小和结构变异等[4]。转座子的注释已成为后基因组时代重要的研究热点,现在也称为转座组(Mobilome)[5]。研究表明转座子在不同物种中分布存在较大差异,转座子占人基因组的45%[6],鼠基因组的40%[7],鸟类基因组的7%-9%[8-9],在部分植物中转座子所占比例更高,如小麦基因组中达到的80%[10],玉米基因组中达到85%[11]。且研究发现转座组大小与基因组的大小具有强正相关性[12-13],相近物种间的基因组差异常常是由转座子的扩增差异导致[14-15]

鱼类是脊椎动物所有纲中最原始的物种,在实验和进化研究中有重要的参考价值,其中硬骨鱼类遗传多样性最高,在非常相近的种系间,其基因组差异很大[16-17],但目前对硬骨鱼类基因组大小差异原因了解较少。本研究通过生物信息学手段对在Ensemble数据库能够获得基因组序列的9种硬骨鱼类(斑马鱼、青鳉、三刺鱼、金娃娃、矛尾鱼、红鳍东方鲀、花斑剑尾鱼、罗非鱼和大西洋鳕)转座组进行注释,以期揭示转座组在硬骨鱼类中的分布特性,及其对基因组变异和进化的影响。

1 材料与方法 1.1 基因组和已知重复序列库数据来源

9种硬骨鱼类包括大西洋鳕鱼(Cod,Gadus morhua,gadMor1)、矛尾鱼(Coelacanth,Latimeria chalumnae,LatCha1)、红鳍东方鲀(Fugu,Takifugu rubripes,FUGU 4.0)、青鳉(Medaka,Oryzias latipes,HdrR)、花斑剑尾鱼(Platyfish,Xiphophorus maculatus,Xipmac4.4.2)、三刺鱼(Stickleback,Gasterosteus aculeatus,BROAD S1)、金娃娃(Tetraodon,Tetraodon nigroviridis,TETRAODON 8.0)、罗非鱼(Tilapia,Oreochromis niloticus,Orenil1.0)、斑马鱼(Zebrafish,Danio rerio,GRCz10)基因组序列来自Ensembl数据库(http://www.ensembl.org/)。9种硬骨鱼类中已知重复序列库来自GIRI的Repbase数据库(http://girinst.org/server/RepBase/index.php),9种硬骨鱼类进化树由在线程序phyloT (http://phylot.biobyte.de/index.html)产生。

1.2 基因组未知重复序列库一致序列的获得

利用RepeatModeler (http://repeatmasker.org/RepeatModeler.html)对9种硬骨鱼类的未知重复序列进行从头注释,获得新一致序列,RepeatModeler主要由RepeatScout和RECON两个核心程序组成,可以对基因组上转座子的进行从头预测,以获得未知的重复序列。

1.3 重复序列参考库构建

将各物种Repbase数据库的已知重复序列库和利用RepeatModeler获得的未知重复序列进行合并,去除冗余,构建重复序列参考库。去除冗余根据80-80-80规则进行[18],即如果两个转座子的序列满足以下3个条件,则两个重复序列可以被划为同一个家族:1)重复序列有80%的相似度;2)重复序列长度有80%的重叠;3)重复序列之间重叠部分至少80 bp长度。

1.4 基因组转座组注释

以构建的重复序列参考库为基础,利用本地RepeatMasker程序[19] (http://repeatmasker.org/)对各物种的转座组进行注释,其运行参数为:-cutoff 225 -w -s -gccalc -no_is。

2 结果与分析 2.1 9种硬骨鱼转座组大小和构成比较

通过RepeatMasker程序注释表明9种硬骨鱼类转座组大小和构成差异显著(表 1)。9种硬骨鱼类转座组含量从高到低分别为斑马鱼(54.96%)、矛尾鱼(41.69%)、青鳉鱼(26.68%)、罗非鱼(25.25%)、花斑剑尾鱼(18.20%)、大西洋鳕鱼(14.08%)、三刺鱼(12.82%)、金娃娃(5.89%)和红鳍东方鲀(2.94%)。斑马鱼和矛尾鱼基因组中转座组含量较高,约占基因组大小的一半,与哺乳动物基因组转座组含量相近。矛尾鱼中的转座组含量虽然较高,但其中多数仍为未知转座子序列,占到整个基因组的26.23%。金娃娃和红鳍东方鲀,转座组含量较低(<10%),其他几种鱼转座组含量在10%-30% (表 1)。通过将基因组大小和转座子含量进行相关性分析发现,在硬骨鱼类中转座子含量和基因组大小具有较强的线性相关(图 1),相关系数r=0.743 P=0.022,达显著水平。在进化上,亲缘关系、基因组大小和转座组大小大体呈现一致性,基因组和转座组较小的几个物种其亲缘关系也较近,如金娃娃、三刺鱼和红鳍东方鲀,而与其亲缘关系较远的斑马鱼、矛尾鱼基因组和转座组含量均较大(图 1图 2)。其中Ⅱ类(DNA转座子)转座子含量差异是9种硬骨鱼类转座组含量差异的主要决定因素。斑马鱼DNA转座子含量最高(38.37%),罗非鱼、青鳉和花斑剑尾鱼分别占到11.22%、8.9%和8.38%,其他6种硬骨鱼中则不到5%。Ⅰ类转座子(RNA转座子)在9种鱼中分布也有明显差异(12.73%-0.99%),在矛尾鱼和斑马鱼基因组中比例较大,而在基因组较小的金娃娃、罗非鱼及红鳍东方鲀中占比例较小。在硬骨鱼类基因组中SINE转座子扩增最弱,其含量在7种硬骨鱼类基因组(金娃娃、红鳍东方鲀、大西洋鳕、青鳉、花斑剑尾鱼、三刺鱼、罗非鱼)中低于1%,仅在斑马鱼和矛尾鱼中较高,分别为3.28%和5.64%。LINE转座子占硬骨鱼类基因组的0.53%-5.75%,显著低于哺乳动物基因组。LTR转座子除了在斑马鱼和三刺鱼中含量达到5.58%和2.51%,在大多硬骨鱼类基因组中的含量也比较低,其基因组含量不超过2%。矛尾鱼的RNA转座子显著多于DNA转座子,而红鳍东方鲀、三刺鱼和金娃娃的RNA转座子略高于DNA转座子;斑马鱼、青鳉鱼、大西洋鳕鱼、罗非鱼和花斑剑尾鱼的DNA转座子显著高于RNA转座子。

表 1 9种硬骨鱼类转座组注释(占基因组比重, %) Table 1 The annotation of mobilome in nine teleost (genome coverage, %)
TE types/Superfamily Cod Coelacanth Fugu Medaka Platyfish Stickle back Tetraodon Tilapia Zebrafish
ClassⅡ(Retrotransposon) 2.74 12.73 0.99 5.88 2.67 5.62 2.47 7.59 12.14
SINE 0.50 5.64 0.04 0.55 0.38 0.66 0.07 0.58 3.28
LINE 1.45 5.66 0.53 3.85 1.86 2.45 1.74 5.75 3.28
LTR 0.79 1.43 0.42 1.48 0.43 2.51 0.66 1.26 5.58
ClassⅡ(DNA transposon) 4.77 2.74 0.50 8.90 8.38 4.04 1.21 11.22 38.37
Unclassified 6.59 26.23 1.44 11.89 7.15 3.16 2.2 6.45 4.46
Total interspersed repeats 14.08 41.69 2.94 26.68 18.2 12.82 5.89 25.25 54.96
Small RNA 0.08 3.63 0.02 0.13 0.08 0.11 0.03 0.06 0.14
Satellites 0.14 0.03 0.01 0.13 0.08 0.09 0.07 0.15 2.42
Simple repeats 3.76 0.12 0.01 0.24 0.33 0.53 0.64 1.46 1.11
Low complexity 0.08 0.01 0.00 0.00 0.00 0.01 0.01 0.24 0.06
Total bases masked 18.02 41.84 2.98 27.08 18.63 13.55 6.63 27.11 57.99
Genome size (Mb) 829 2 700 381 843 708 447 347 899 1 330
图 1 转座组比重与基因组大小关联 Figure 1 The correlation between the percentage of mobilome and genome size.
图 2 9种硬骨鱼类进化树 Figure 2 The polygenetic tree of 9 teleost.
2.2 DNA转座子在硬骨鱼类中的分布

转座组注释表明DNA转座子在9种硬骨鱼类呈现很高的多样性,共有22个超家族分布,其中大西洋鳕鱼、斑马鱼、罗非鱼、青鳉、三刺鱼和花斑剑尾鱼基因组中DNA转座子超家族较多,分别含17、16、16、14、14和13个超家族,而红鳍东方鲀、矛尾鱼和金娃娃略少,分别发现5、9和8个超家族(表 2)。hAT和Tc/Mariner超家族是硬骨鱼类主要的DNA转座子。hAT超家族是DNA转座子中含量最丰富且最具多样性的,其在斑马鱼、罗非鱼、三刺鱼、花斑剑尾鱼、青鳉、矛尾鱼和大西洋鳕鱼基因组中分别占11.14%、3.10%、1.88%、2.61%、3.64%、1.28%和1.33%,而在红鳍东方鲀(0.23%)和金娃娃(0.62%)中含量较低(表 2)。Tc1/Mariner超家族是硬骨鱼基因组中第二丰富的DNA转座子,在斑马鱼、罗非鱼、花斑剑尾鱼和青鳉中分别占测序基因组的5.6%、4.48%、4.25%及2.3%,在红鳍东方鲀(0.20%)、三刺鱼(0.74%)、金娃娃(0.43%)、矛尾鱼(0.28%)和大西洋鳕鱼(0.18%)中含量较低。在大西洋鳕鱼、罗非鱼、矛尾鱼基因组中发现Novosib超家族转座子,且在大西洋鳕鱼(1.14%)中占据较高比例,而在其他硬骨鱼类中没有发现。另外,CMC-EnSpm、PIF、MULE-MuDR、Kolobok和PiggyBac等转座子也出现在硬骨鱼DNA转座子中,且有些(CMC-EnSpm和PIF-Harbinger)在斑马鱼基因组中含量比较高(表 2)。

表 2 DNA转座子在9种硬骨鱼类基因组中分布(拷贝数/(占基因组比重,%)) Table 2 The distribution of DNA transposons in nine teleost (copy number/(genome coverage, %))
Superfamily Cod Coelacanth Fugu Medaka Platyflsh Stickback Tetradon Tiplia Zebrafish
Academ 147/0.00 ND ND 791/0.02 752/0.03 339/0.01 ND 184/0.00 ND
CMC-Chapaev-3 ND ND 119/0.01 42/0.00 345/0.02 ND ND 108/0.00 ND
CMC-EnSpm 12 567/0.16 24 770/0.07 ND 162/0.00 1 702/0.03 5 802/0.44 1 527/0.03 9 252/0.26 332 810/4.03
Crypton 3 061/0.06 ND ND 8 468/0.22 ND ND ND ND 3 567/0.04
Dada 70/0.00 ND 41/0.01 2 122/0.02 ND 118/0.01 914/0.03 ND 37 148/0.21
Ginger 11 379/0.13 ND ND 235/0.01 ND ND ND ND 2 201/0.01
IS3EU ND ND ND ND ND ND ND 1 301/0.02 ND
Kolobok 4 315/0.11 ND ND ND 589/0.02 596/0.02 ND 208/0.00 101 842/1.70
MULE-MuDR 3 935/0.08 2 629/0.02 13/0.00 206/0.01 799/0.02 70/0.00 ND 43/0.00 4 350/0.16
Maverick 61/0.00 ND ND ND 202/0.01 648/0.12 1 245/0.03 ND 24 570/0.20
Novosib 101 975/1.14 4 014/0.01 ND ND ND ND ND 1 927/0.04 ND
P 1 043/0.03 ND ND ND ND ND ND 1 590/0.06 5 959/0.10
PIF-Harbinger 21 015/0.54 42 995/0.57 869/0.05 32 438/1.35 11 149/0.45 2 823/0.29 538/0.03 15 857/0.37 96 261/2.25
PIF-ISL2EU 714/0.02 ND ND 216/0.02 846/0.03 365/0.05 ND 1 166/0.06 2 094/0.01
PiggyBac 139/0.01 11 276/0.07 3/0.00 33 581/0.72 7 741/0.32 910/0.03 359/0.03 7 077/0.21 76 940/1.95
Sola 51 782/0.55 9 028/0.18 ND 1 246/0.04 ND 419/0.05 ND 175/0.01 8 425/0.12
Tel/Mariner 6 502/0.18 35 889/0.28 4 079/0.20 64 842/2.30 196 639/4.25 9 451/0.74 4 865/0.43 165 077/4.48 291 768/5.60
hAT 54 190/1.33 192 018/1.28 2 491/0.23 116 870/3.64 92 699/2.61 29 386/1.88 11 070/0.62 111284/3.10 729 826/11.14
Merlin ND ND ND ND ND 715/0.10 ND ND ND
Zator ND 1 226/0.00 ND ND ND ND ND ND ND
Zisupton ND ND ND ND 62/.00 ND ND 240/0.01 381 363/0.03
Helitron 2 591/0.09 29 295/0.64 ND 3 044/0.04 6 070/0.18 1 727/0, 05 187/0.01 1 789/0.06 134 687/1.44
Unclassified DNA repeats 24 722/0.65 38 420/0.25 1 004/0.05 21 838/0.56 20 502/0.64 8 249/0.30 94/0.00 65 632/1.22 585 218/10.41
2.3 RNA转座子在硬骨鱼类中的分布

基因组注释结果表明RNA转座子(LINE、LTR和SINE)在9种硬骨鱼类呈现不同分布特点。其中LINE和LTR转座子在9种硬骨鱼类中也呈现出很高的多样性。LINE类转座子中共有14个超家族分布(表 3)。这些LINE超家族在9种硬骨鱼类基因组中呈现不同程度的扩增,其中L1、L2、RTE和Rex-Babar转座子扩增最为明显,尤其是L2超家族,在罗非鱼(1.96%)、矛尾鱼(1.73%)、青鳉(1.52%)、三刺鱼(1.27%)和斑马鱼基因组(1.72%)组成中都超过1%;RTE组在青鳉基因组中扩增最为丰富,达到0.86%;而Rex组在三刺鱼、金娃娃和罗非鱼基因组中扩增明显,分别达到0.66%、0.67%和0.86。Proto2、CR1、Dong-R4、Jockey、R1、DRE和TAD1等仅在个别鱼类中被检测出来,且基因组含量也较小(0.01%-0.08%),但CR1在矛尾鱼扩增达到2.16%。R1和DRE只分布在青鳉中,而TAD1只分布在花斑剑尾鱼中。LTR类转座子共有6类超家族分布(Copia、DIRS、ERV、Gypsy、Ngaro和Pao),其中扩增最为明显的是Gypsy,在青鳉、罗非鱼、大西洋鳕鱼、三刺鱼和斑马鱼中分别达到0.70%、0.0.47%、0.47%、1.57%和1.80%。DIRS在矛尾鱼(1.00%)和斑马鱼(1.30%)中有一定程度的扩增,而在花斑剑尾鱼(0.01%)、三刺鱼(0.02%)、金娃娃(0.05%)和红鳍东方鲀(0.00%)中扩增很弱。ERV在大多硬骨鱼类基因组中丰度较低(<0.50%),其中三刺鱼(0.52%)和斑马鱼(0.47%)基因组中ERV转座子含量高于大西洋鳕鱼(0.10%)、矛尾鱼(0.07%)及青鳉(0.07%),而在花斑剑尾鱼中未检测到ERV分布。Ngaro、Copia和Pao超家族转座子在硬骨鱼类基因组中含量较少,Copia超家族在各鱼类基因组中都不超过0.1%。SINE中tRNA、5S和MIR三个超家族在部分硬骨鱼类中有一定程度扩增。其中tRNA超家族在矛尾鱼(4.09%)和斑马鱼(2.57%)基因组中有明显扩增,5S超家族在矛尾鱼(1.48%)中有明显扩增,其他超家族成员占基因组的含量均很低(<0.50%)。

表 3 RNA转座子在9种硬骨鱼类基因组中分布(拷贝数/(占基因组比重,%)) Table 3 The distribution of RNA transposons in nine teleost (copy number/(genome coverage, %))
TE type/ Superfamily Cod Coelacanth Fugu Medaka Platyfish Stickback Tetradon Tiplia Zebrafish
LINE I 170/0.01 ND 108/0.01 238/0.01 1 120/0.05 672/0.04 356/0.04 901/0.04 8220/0.21
LI 1 528/0.05 41 636/0.85 702/0.08 7 815/0.45 906/0.05 855/0.12 443/0.09 8 190/0.35 17287/0.66
L2 44493/0.96 142 648/1.73 1 388/0.15 37 713/1.52 29 580/0.89 17 915/1.27 3 434/0.17 76 908/1.96 67 694/1.72
RTE 6332/0.23 75 425/0.59 426/0.02 30 208/0.86 7 154/0.30 2 158/0.27 2 631/0.30 30 100/0.85 9 520/0.27
Penelope 554/0.02 17 632/0.17 854/0.04 6306/0.13 735/0.01 132/0.05 4624/0.29 24 994/0.50 861/0.01
Rex-Babar 7 680/0.25 ND 2 805/0.22 14 481/0.52 19 395/0.49 8 551/0.66 7 517/0.67 28 223/0.86 22281/0.39
R2 533/0, 01 ND 186/0.03 270/0.01 479/0.04 ND 1 009/0.19 896/0.05 261/0.01
Proto2 249/0.01 ND ND 903/0.04 160/0.01 151/0.01 ND 152/0.01 ND
CR1 ND 175 626/2.16 69/0.01 1 262/0.06 ND ND ND ND 1/0.00
Dong-R4 ND ND 12/0.00 3 970/0.22 445/0.01 ND ND 10 743/0.33 ND
Jockey ND 6 693/0.08 ND ND 827/0.01 241/0.00 ND 1 919/0.07 ND
R1 ND 2 902/0.00 ND 247/0.00 ND ND ND ND ND
DRE ND ND ND 245/0.01 ND ND ND ND ND
TAD1 ND ND ND ND 201/0.02 ND ND ND ND
Unclassified 140/0.00 333/0.00 ND 159/0.01 116/0.01 ND ND 908/0.04 ND
LTR Copia 302/0, 01 7 343/0.03 191/0.01 446/0.03 ND 158/0.03 309/0.03 844/0.03 687/0.07
DIRS 4 467/0.23 45 718/1.00 6/0.00 ND 300/0.01 327/0.02 262/0.05 2 047/0.10 17112/1.30
ERV 3 680/0.10 8 876/0.07 1 336/0.22 1 062/0.07 ND 6 667/0.52 5 810/0.18 2 711/0.16 29 073/0.47
Gypsy 9 940/0.47 29 760/0.27 1811/0.19 12 557/0.70 4 611/0.19 13 377/1.57 2422/0.25 12475/0.47 54 386/1.80
Ngaro 329/0.01 ND ND 29 765/0.67 7207/0.16 3 509/0.18 2292/0.12 14 774/0.24 48 391/0.82
Viper ND ND 50/0.01 ND ND ND ND ND ND
Pao 446/0.03 6 821/0.03 86/0.02 146/0.01 ND 1 687/0.19 182/0.01 1 263/0.10 5 091/0.21
Unclassified ND 5 954/0.03 1/0.00 ND 1 207/0.07 294/0.02 83/0.01 ND 36 121/0.87
SINE MIR 2 040/0.01 14 649/0.06 ND 17498/0.37 2 504/0.05 2 727/0.11 108/0.00 5 662/0.10 ND
tRNA 15 898/0.30 415 631/4.09 503/0.01 6117/0.10 14 005/0.27 6 381/0.41 376/0.01 25 167/0.40 170661/2.57
5S 2 176/0.03 196 003/1.48 223/0.02 671/0.01 ND ND 41/0.01 106/0.00 17 722/0.43
ID 451/0.01 463/0.00 ND ND ND 220/0.02 ND ND ND
U ND ND ND ND ND 98/0.01 ND ND ND
7SL ND ND ND ND ND ND 114/0.01 ND ND
Alu ND ND ND ND ND ND 60/0.01 ND ND
L2 ND ND ND ND ND ND ND ND 3 745/0.03
Mermaid ND ND 17/0.00 ND ND ND ND ND ND
Unclassified 13 067/0.18 ND 168/0.01 6 116/0.07 3 368/0.05 2 176/0.11 824/0.03 919/0.01 5 263/0.20
3 讨论

通过RepeatMasker注释,本研究获得了9种硬骨鱼类的转座组数据。不同于其他脊椎动物,硬骨鱼基因组中转座子的扩张呈现很大的差异性(2.94%-54.96%),远远超过脊椎动物中的哺乳动物(36%-52%)[6-7, 20-22]、蝾螈(25%-48%)[23]或鸟类等物种间的差异(7%-9%)[8-9]。本研究中斑马鱼的转座组占基因组的比例(54.96%)与先前的报道(51.83%)相似[24],与哺乳动物转座子比例相近,高于目前大多数报道的脊椎动物,如鲤鱼(31.3%)[25]、蜥蜴(34.4%)[26]、青蛙(34.5%)[27]和鸟类(7%-9%)[9, 28]。本研究所注释红鳍东方鲀转座组(2.94%)与先前的报道相近(2.7%)[29]。大西洋鳕鱼转座组注释结果(14.08%)也与前期注释(12.31%)相近[30],而本研究其他大部分转座组注释结果均高于前期注释,如矛尾鱼(41.69% vs 25%)[31]、花斑剑尾鱼(18.5% vs 5%)[32]、罗非鱼(25.25% vs 14%)[33]、青鳉(26.68% vs 16.2%)[34]、金娃娃(5.89% vs<1%)[35]。造成这种差异的主要原因是之前组装的基因组数据与重复序列库数据不完整,特别是早期重复序列库数据缺乏,导致转座组比重被严重低估。本研究中三刺鱼所注释转座组的覆盖率(12.82%)远远低于先前的估量(25.2%)[36],由于文献中没有提供注释的方法,所以差异的原因并不清楚。

研究表明遗传关系相近的物种之间基因组大小差异可归因于转座子积累程度不同[14-15],本研究对硬骨鱼的转座子注释进一步证实了这一理论。在9个硬骨鱼中预测出的转座子比重和基因组大小呈正相关,且与进化上的亲缘关系相一致,如最小基因组红鳍东方鲀转座子比例为5.89%,而最大基因组斑马鱼的转座组则高达54.96%,转座组差异主要是由DNA转座子的扩增量不同导致。以DNA转座子为主的转座子的不同扩增量是促成硬骨鱼基因组大小差异的主要分子机制。这与两栖类相似[26-27],但与多数哺乳动物和爬行动物的相反。哺乳动物和爬行动物的基因组扩张主要取决于LTR或非LTR反转录转座子[6-7, 20-22]。本文为从转座子角度揭示物种进化提供参考。

相比于哺乳动物和鸟类,硬骨鱼基因组含有多种Ⅰ类和Ⅱ转座子,并且拥有大量进化分支、超家族和家族[12],本研究显示9个硬骨鱼类基因组中转座组分布差异明显。虽然DNA转座子是引起转座子扩增差异的主要力量,但基因组中转座子的差异不仅仅局限于扩增量的不同。转座子的多样性在不同硬骨鱼类基因组中也存在较大差异,在较大的转座组物种中如斑马鱼、大西洋鳕鱼、青鳉,其转座子多样性也较高,这也是造成硬骨鱼基因组的差异原因之一。在硬骨鱼中,转座子在超家族水平上呈现出较大的差异,和较大的基因组相比,较小的基因组含有较低多样性,这与在蜥蜴中的结果相一致[23]。目前关于脊椎动物基因组内转座子多样性和活性差异原因的了解仍然非常有限,有学者认为这可能是由于抑制转座子活性的宿主防御机制差异导致的[37]

4 结论

本研究对9种硬骨鱼类转座组进行了全面系统的注释,分析结果显示,硬骨鱼基因组中转座子多样性丰富,转座子在基因组中的分布比例差异很大,尤其是DNA转座子,转座组差异与硬骨鱼基因组大小有很强的相关,转座组是决定硬骨鱼基因组大小的重要因素。

参考文献
[1] Finnegan DJ. Eukaryotic transposable elements and genome evolution. Trends Genet, 1989, 5: 103–107. DOI: 10.1016/0168-9525(89)90039-5
[2] Kapitonov VV, Jurka J. A universal classification of eukaryotic transposable elements implemented in Repbase. Nat Rev Genet, 2008, 9(5): 411–422. DOI: 10.1038/nrg2165-c1
[3] Pray L. Transposons: the jumping genes. Nature Education, 2008, 1(1): 204.
[4] Jurka J, Kapitonov VV, Kohany O, et al. Repetitive sequences in complex genomes: structure and evolution. Annu Rev Genomics Hum Genet, 2007, 8: 241–259. DOI: 10.1146/annurev.genom.8.080706.092416
[5] Babatz TD, Burns KH. Functional impact of the human mobilome. Curr Opin Genet Dev, 2013, 23(3): 264–270. DOI: 10.1016/j.gde.2013.02.007
[6] Lander ES, Linton LM, Birren B, et al. Initial sequencing and analysis of the human genome. Nature, 2001, 409(6822): 860–921. DOI: 10.1038/35057062
[7] Chinwalla AT, Cook LL, Delehaunty KD, et al. Initial sequencing and comparative analysis of the mouse genome. Nature, 2002, 420(6915): 520–562. DOI: 10.1038/nature01262
[8] Wicker T, Robertson JS, Schulze SR, et al. The repetitive landscape of the chicken genome. Genome Res, 2004, 15: 126–136. DOI: 10.1101/gr.2438004
[9] Warren WC, Clayton DF, Ellegren H, et al. The genome of a songbird. Nature, 2010, 464(7289): 757–762. DOI: 10.1038/nature08819
[10] Charles M, Belcram H, Just J, et al. Dynamics and differential proliferation of transposable elements during the evolution of the B and A genomes of wheat. Genetics, 2008, 180(2): 1071–1086. DOI: 10.1534/genetics.108.092304
[11] Schnable PS, Ware D, Fulton RS, et al. The B73 maize genome: complexity, diversity, and dynamics. Science, 2009, 326(5956): 1112–1115. DOI: 10.1126/science.1178534
[12] Chalopin D, Naville M, Plard F, et al. Comparative analysis of transposable elements highlights mobilome diversity and evolution in vertebrates. Genome Biol Evol, 2015, 7(2): 567–580. DOI: 10.1093/gbe/evv005
[13] Hawkins JS, Kim H, Nason JD, et al. Differential lineage-specific amplification of transposable elements is responsible for genome size variation in Gossypium. Genome Res, 2006, 16(10): 1252–1261. DOI: 10.1101/gr.5282906
[14] Lee SI, Kim NS. Transposable elements and genome size variations in plants. Genomics Inform, 2014, 12(3): 87–97. DOI: 10.5808/GI.2014.12.3.87
[15] Zuccolo AI, Sebastian A, Talag J, et al. Transposable element distribution, abundance and role in genome size variation in the genus Oryza. BMC Evol Biol, 2007, 7: 152. DOI: 10.1186/1471-2148-7-152
[16] Volff JN. Genome evolution and biodiversity in teleost fish. Heredity, 2005, 94(3): 280–294. DOI: 10.1038/sj.hdy.6800635
[17] Venkatesh B. Evolution and diversity of fish genomes. Curr Opin Genet Dev, 2003, 13(6): 588–592. DOI: 10.1016/j.gde.2003.09.001
[18] Wicker T, Sabot F, Hua-Van A, et al. A unified classification system for eukaryotic transposable elements. Nat Rev Genet, 2007, 8(12): 973–982. DOI: 10.1038/nrg2165
[19] Tarailo-Graovac M, Chen N. UNIT 4.10 Using RepeatMasker to identify repetitive elements in genomic sequences//Current Protocols Bioinformatics. New York: John Wiley and Sons, 2009.
[20] Li RQ, Fan W, Tian G, et al. The sequence and de novo assembly of the giant panda genome. Nature, 2010, 463(7279): 311–317. DOI: 10.1038/nature08696
[21] Kirkness EF, Bafna V, Halpern AL, et al. The dog genome: survey sequencing and comparative analysis. Science, 2003, 301(5641): 1898–1903. DOI: 10.1126/science.1086432
[22] Murchison EP, Adams DJ. Sequencing skippy: the genome sequence of an Australian kangaroo, Macropus eugenii. Genome Biol, 2011, 12: 123. DOI: 10.1186/gb-2011-12-8-123
[23] Sun C, Shepard DB, Chong RA, et al. LTR retrotransposons contribute to genomic gigantism in plethodontid salamanders. Genome Biol Evol, 2012, 4(2): 168–183. DOI: 10.1093/gbe/evr139
[24] Howe K, Clark MD, Torroja CF, et al. The zebrafish reference genome sequence and its relationship to the human genome. Nature, 2013, 496(7446): 498–503. DOI: 10.1038/nature12111
[25] Xu P, Zhang XF, Wang XM, et al. Genome sequence and genetic diversity of the common carp, Cyprinus carpio. Nat Genet, 2014, 46(11): 1212–1219. DOI: 10.1038/ng.3098
[26] Alf ldi J, Di Palma F, Grabherr M, et al. The genome of the green anole lizard and a comparative analysis with birds and mammals. Nature, 2011, 477(7366): 587–591. DOI: 10.1038/nature10390
[27] Hellsten U, Harland RM, Gilchrist MJ, et al. The genome of the Western clawed frog Xenopus tropicalis. Science, 2010, 328(5978): 633–636. DOI: 10.1126/science.1183670
[28] Hillier LW, Miller W, Birney E, et al. Sequence and comparative analysis of the chicken genome provide unique perspectives on vertebrate evolution. Nature, 2004, 432(7018): 695–716. DOI: 10.1038/nature03154
[29] Aparicio S, Chapman J, Stupka E, et al. Whole-genome shotgun assembly and analysis of the genome of Fugu rubripes. Science, 2002, 297(5585): 1301–1310. DOI: 10.1126/science.1072104
[30] Star B, Nederbragt AJ, Jentoft S, et al. The genome sequence of Atlantic cod reveals a unique immune system. Nature, 2013, 477(7363): 207–210.
[31] Amemiya CT, Alf ldi J, Lee AP, et al. The African coelacanth genome provides insights into tetrapod evolution. Nature, 2013, 496(7445): 311–316. DOI: 10.1038/nature12027
[32] Schartl M, Walter RB, Shen YJ, et al. The genome of the platyfish, Xiphophorus maculatus, provides insights into evolutionary adaptation and several complex traits. Nat Genet, 2013, 45(5): 567–572. DOI: 10.1038/ng.2604
[33] Shirak A, Grabherr M, Di Palma F, et al. Identification of repetitive elements in the genome of Oreochromis niloticus: tilapia repeat masker. Mar Biotechnol (NY), 2010, 12(2): 121–125. DOI: 10.1007/s10126-009-9236-8
[34] Kasahara M, Naruse K, Sasaki S, et al. The medaka draft genome and insights into vertebrate genome evolution. Nature, 2007, 447(7145): 714–719. DOI: 10.1038/nature05846
[35] Crollius HR, Jaillon O, Dasilva C, et al. Characterization and repeat analysis of the compact genome of the freshwater pufferfish Tetraodon nigroviridis. Genome Res, 2000, 10(7): 939–949. DOI: 10.1101/gr.10.7.939
[36] Peichel CL, Nereng KS, Ohgi KA, et al. The genetic architecture of divergence between threespine stickleback species. Nature, 2001, 414(6866): 901–905. DOI: 10.1038/414901a
[37] Abrusán G, Krambeck HJ. Competition may determine the diversity of transposable elements. Theor Popul Biol, 2006, 70(3): 364–375. DOI: 10.1016/j.tpb.2006.05.001