摘要
刺鳖全基因组测序分析及其ZZ/ZW性染色体的研究
摘要
刺鳖(Apalonespinifera)个体大、生长速度快,是一种具有极高经济价值的
淡水养殖动物,近年来,中国已开始引进试养刺鳖。已有研究表明,刺鳖具有基
因型性别决定机制(GenotypicSexDetermination,GSD),为雌性异配,即ZZ(雄
性)/ZW(雌性)型。传统的性染色体起源和演化的观点认为,由于X和Y或Z
和W性染色之间发生重组抑制,演化的结果是大多数物种的X或Z染色体大于
Y或W染色体。然而一个有趣的现象是,刺鳖的W染色体大于Z染色体。为了
研究刺鳖的ZW性染色体的分化,分析其W染色体变大的原因,本研究采用
PacbioHiFi测序技术与Hi-C测序技术相结合的方式,对刺鳖的基因组进行了染
色体水平的组装,并结合重测序技术,深入探讨了其ZW的性染色体分化,获得
的结果如下:
1.利用PacBioHiFi三代测序对刺鳖的基因组进行了测序组装注释,本研究
获得了质控后总数据量为89.2Gb的高质量数据,其测序深度达到了约39X,且
HiFireads的读长较长,完全满足了基因组组装的需求。利用这些HiFi数据,成
功地组装出了一个初步的基因组(PreliminaryAssembly)。这个基因组包含383
个contigs,其中382个contigs的长度都大于或等于5kb。整体基因组大小约为
2.31Gb,显示出极高的完整性和连续性。其中,最长读长达到了212,584,847bp,
显示出测序技术的高分辨率和准确性。此外,N50大小约为79.21Mb,这也是评
估基因组组装质量的重要指标之一。较大的N50值意味着组装得到的基因组中
含有更多较长的contigs,从而提高了基因组的连续性和完整性。综上所述,通过
HiFi测序技术和精细的组装流程,本研究得到了一个高质量、高连续性的初步基
因组,为后续的生物信息学分析和研究提供了坚实的基础。
2.进一步结合Hi-C技术,进行染色体水平的组装,共有2.23Gb的contigs挂
载到34条染色体上,挂载率高达96.3%,这充分展示了基因组组装的高准确性。
此外,基因组中97.7%的完整基因原件得以发现,进一步印证了组装的高完整性。
为了深入理解这一基因组,我们进行了重复序列和编码基因的注释工作。分析结
果显示,共有1,313,450,876bp的重复序列被注释,占据了刺鳖全基因数据的56.8%,
这为理解其基因组结构提供了重要线索。同时,预测到了26,697个基因,其中
20,225个基因得到了重新注释,这为后续的功能研究和基因表达分析奠定了坚实
基础。综上所述,通过结合Hi-C技术和精细的注释工作,本研究对刺鳖的基因组
有了更加全面和深入的认识,这为后续的生物信息学研究和实际应用提供了重要
I
摘要
资源。
3.选择了刺鳖的3只雄性和3只雌性个体进行重测序,同时进行了Reads
Coverage和SNPdensity分析,结果显示,在雌性与雄性中均有32条染色体的Reads
Coverage和SNPdensity集中在零,即雌性与雄性常染色体比值为1:1,利用统计
学方法进行log2(maleSNPdensity)-log2(femaleSNPdensity)的标准化处理后,
1
其log2等于0,表明了这些染色体是常染色体。然而,在雄性中chr19表现出较高
的ReadsCoverage和SNPdensity的比值,在chr34则表现出较低的值。随后,分析
了雌性和雄性中chr19和chr34中的ReadsCoverage。其中,在chr19中发现雄性的
ReadsCoverage为1,雌性的ReadsCoverage为0.5,雄性是雌性的2倍,有力地支持
了chr19是Z染色体(chr19:36.63Mb)。而在雄性中chr34的ReadsCoverage几乎
为0,其雌性chr34的ReadsCovera