校正(二代测序):76 bp, 100 bp or 125 bp strand-specific paired-end sequencing on Illumina HiSeq 2500 or Illumina HiSeq 2000, respectively. 524,974,802 paired-end (2x250 bp) Illumina reads(seven-fold coverage of the genome). The reads were mapped to the PacBio genome assembly by Bowtie2.
Mapping: Saphyr System (Bionano) Bionano Solve 2.1 software
数据:https://genome.axolotl-omics.org NCBI BioProject database with accession numbers PRJNA378970 (genome data)
结 果
1.基因组测序组装
选取D/D品系(易于活体成像)进行基因组测序,基因组的组装参照fig1.b,采用PacBio三代长读长测序(读长达到57Kb(fig1c), 蝾螈最长的重复序列是34Kb),使用MARVEL进行组装,采用二代测序数据进行基因组矫正,contig组装采用Bionano(N50 contig 长度216kb,fig1.d),最终得到的N50 scaffold 长度3Mb。
组装的完整性评估,首先分析了non-exonic ultraconserved elements (UCEs),98.5%的在脊椎动物和蝾螈中保守。另外为了评价完整性,研究还对22个组织的转录组进行了测序,85%的转录本能够比对到基因组上。同时通过全面的转录组数据集,对蝾螈基因组基因进行注释得到23251个编码基因。
2.蝾螈基因组存在大量的长末端重复反转录转座子
Contig中有65.6%,18.6Gb的重复序列,其中主要为LTR retroelement classes 和endogenous retroviruses(Fig2.a,b),并且包含超过10Kb的元件(Fig2.c)。重复序列的替换数目用来估计LTR retroelement的相对进化年限,通过分析发现蝾螈基因组经历了长周期的转座子活性,随后是最近的并且明显持续的扩张爆发(Fig2.d)
另外,蝾螈基因组的内含子长度要远大于人,小鼠和青蛙的;并且在内含子的扩增上,发育相关基因中的内含子扩增是受限的,而在人等其他物种中,发育与非发育相关基因中内含子的大小并无明显不同(Fig3.a)。Fig3.b具体展现了典型基因AGR2的事例。
3.HoxA基因簇分析
为了研究基因簇的组成,这里对HoxA位点进行了研究,HoxA在近端到远端的肢体发育过程中发挥重要的作用,并且在肢体再生中被重新激活。如Fig3.c所示,蝾螈的HoxA是人等同源基因的3.5倍长,而且存在多的重复,这很大程度上归因于HoxA3与HoxA4之间存在170Kb长的扩增。
4.蝾螈基因组缺少PAX3
经典的发育信号分子家族的分析,在蝾螈中,hedgehog和Wnt是存在的(Extended Data Figure 2.a,b)。但是PAX蛋白中,蝾螈基因组缺少PAX4含有PAX10,缺少PAX3含有PAX7 (Extended Data Figure 2.c)。
在蝾螈基因组中Sgpp2和Epha4(这两个基因在小鼠中存在于Pax3的两侧)存在,但是并没有Pax3,而且pax3相关的非内含子元件(CNEs)也不存在(Fig3.d)。
5.Pax7具有与Pax3类似的功能
在其他脊椎动物中,Pax7和Pax3在肌肉、神经管和神经嵴来源的组织发育中发挥重要的作用,在蝾螈中Pax3缺失,Pax7是不是具有类似的功能。文章采用TALEN和CRISPR技术(Fig4.a)对Pax7进行突变来进行研究。
Pax7突变缺失后,早期(17,20天)肌肉量上并没有体现不同,之后会影响蝾螈的直立姿态和延迟生长。6月大的蝾螈身体延伸出现问题(Fig4.b),体壁肌肉明显减少(Fig4.c);3月大的蝾螈肢体(前肢)肌肉减少(Fig4.d);前额骨发育缺陷(Fig4.e,小鼠Pax7缺失影响面部骨骼发育,面部骨骼是神经嵴的衍生物);黄色素细胞(Fig4.f)和眼睛虹彩细胞(金色素)减少(Fig4.g,斑马鱼Pax7突变黄色素细胞和虹彩细胞消失);神经管闭合出现问题(Fig4.h)。此外,像躯干肌肉(Extended Data Figure 4)和尾部肌肉(Extended Data Figure 4)同样受到影响,而非肌肉组织,如TU-J1和MBP的表达不受影响(Extended Data Figure 7.b,c)。
我只是分割线
测序组装32G的超大基因组不是一件容易事,感兴趣的科研汪可以研究下MARVEL, 对于研究再生的也可以偷偷关注下。没有生信基础又想搞研究那怎么办,请看下面
地址: 山东省泰安市高新区南天门大街
中国泰山高端人才创业基地511室
返回搜狐,查看更多