基本信息
文件名称:生物化学概述.pptx
文件大小:3.01 MB
总页数:9 页
更新时间:2025-05-23
总字数:约1.61千字
文档摘要

汇报时间:2024.12.31环境与资源学院汇报学生:倪焕博同组成员:吴涵、姜鑫岳、于静Thecompletetelomere-to-telomeresequenceofamousegenome完整的端粒到端粒小鼠参考基因组序列

西湖大学生命科学学院、西湖实验室俞晓春团队在解析小鼠参考基因组方面重要突破。这意味着人类历史上第一次看清小鼠基因组DNA全貌。一、前言10.1126/science.adq8191

小鼠,是生命科学研究中最常见的实验动物和模式生物,这是因为许多生物实验不宜在人体内进行,因此,小鼠的基因组DNA信息直接关系到人类健康的探索。目前小鼠的基因“档案”中,最完整的是参考基因组GRCm39,同样也存在约7~8%未被解析的区域。未知的基因组DNA里或许隐藏着一些至今无法解释的遗传性疾病的谜底。一、前言*常见的模式生物

这些“空白”尤其存在于异染色质和核糖体DNA(rDNA)区域。这些区域富含重复的基因序列,即一些反复出现的,看似近乎一模一样、但实则有细微区别的片段。二代基因测序技术仅能测出其中的一段(且由二代技术完成的小鼠基因组图谱中还有错误),对完整的排序序列“束手无策”;而三代技术可以“完全看清”。由于人类基因组包含大约30亿个碱基对,能够读取更长片段的第三代基因测序技术的出现,为科学家破解完整的人类基因图谱的进程按下加速键。

俞晓春团队综合了众多三代基因测序技术,让它们互相补足,开发了一把能够充分挖掘小鼠基因的“金铲子”。他们以最常用的小鼠C57BL/6的单倍体胚胎干细胞(mhaESC)为样本,进行了基因测序和组装,获得了长度为2.77Gbp(表示十亿个碱基对)的完整的高质量小鼠参考基因组序列,其中包含215.23Mbp(表示一百万个碱基对)先前未被鉴定的序列,填补了约7.7%的基因组空白。mhaESC基因组与先前参考基因组的共线性比对结果二、研究方法

二、研究方法结合了PacBioHiFi、OxfordNanopore超长读长测序、短读Illumina测序等多种技术,确保了数据的全面性和准确性。具体的组合比例为:65×PacBioHiFi、60×ONT、60×短读Illumina、112×Hi-C及BioNano光学图谱。

PacBioHiFicircularconsensussequencing(HiFi):这是一种长读长测序技术,能够提供高度准确的序列信息,有助于解决基因组中的复杂区域。OxfordNanoporeultralong-readsequencing(ONT):这是另一种长读长测序技术,能够产生超过100kb的读长,有助于跨越重复序列和结构变异区域。Illuminashort-readsequencing:这是一种短读长测序技术,虽然读长较短,但能够提供高覆盖度和高精确度的序列数据。IlluminaArimaGenomicsHi-C:这是一种用于研究染色体三维结构的技术,通过Hi-C可以了解染色体内部的相互作用和空间组织。BioNanoopticalmaps:这是一种基于光学的基因组图谱技术,可以提供基因组的大尺度结构信息,有助于识别大的结构变异和基因组组装的验证。

总结在T2T-mhaESC中共注释了22,113个蛋白编码基因,相较于GRCm39的GENCODEvM33注释,多出了639个基因,其中包括289个基因为已注释基因的重复。通过数字PCR(ddPCR)估计mhaESC中含有84个rDNA单位,且使用荧光原位杂交(FISH)技术确认这些rDNA拷贝分布在12、15、16、18和19号染色体上。研究还揭示了小鼠基因组中着丝粒的结构,包括小卫星和大卫星的长度变化,并且发现多个转座元件的插入。

谢谢汇报学生:倪焕博同组成员:吴涵、姜鑫岳、于静