3
《单细胞测序单细胞转录组数据集》编制说明
(一)工作简况,包括任务来源、协作单位、起草过程、国家标准主要起草人及其所做的工作等
1、任务来源
本标准根据国标委公布的2024年第一批国家标准计划项目(国标委发【2024】16号),本项目计划编号为T-469,名称为《单细胞测序单细胞转录组数据集》。
本标准由全国生化检测标准化技术委员会(SAC/TC387)提出并归口。
本标准由深圳华大生命科学研究院、杭州华大生命科学研究院、中国科学院北京基因组研究所(国家生物信息中心)、中山大学、武汉华大生命科学研究院、深圳华大基因科技有限公司、广州基迪奥生物科技有限公司、西北农林科技大学、中国科学院武汉植物园、深圳裕策生物科技有限公司、菁良科技(深圳)有限公司联合起草。
2、目的和意义
规范单细胞测序场景中单细胞转录组数据及数据元的定义、数据格式要求和数据归档目录要求,以及单细胞转录组研究过程中相关数据元和值域的要求,解决组学数据中有关单细胞转录组数据信息的存储、管理、交换与共享过程中的主要问题。单细胞转录组技术已经取得了很大的进展,在国内外已经形成了一定的规模和影响力,有足够的经验和技术基础来制定标准。此外,标准化的单细胞转录组数据集也可以借鉴其他生物信息学数据集的标准化经验,使得标准的制定更加可行和有效。同时本标准主要目的为了单细胞测序行业在数据分析过程中规范化数据格式和归档的要求,为了提高数据的可比性和可重复性。制定标准可以规范数据的质量、格式和注释方式,使得不同实验室产生的数据集可以更好地比较和整合,从而提高数据的可比性和可重复性。促进单细胞转录组技术的发展和应用。标准化的数据集可以更好地支持单细胞转录组技术的应用和发展,为研究人员提供更好的数据资源和分析工具,促进单细胞转录组技术的应用和发展。提高数据的可信性和可靠性。制定标准可以规范数据的质量控制和数据处理流程,从而提高数据的可信性和可靠性,为研究人员提供更加准确和可靠的数据资源,为组学数据的应用提供保障,包括生物医学研究、生物工程和精准医疗等领域。
对于数据安全方面,为了合理制定单细胞转录组数据集的分级分类原则,将单细胞数据的内容、用途和来源进行分类,依照单细胞数据的内容敏感程度、价值、影响情况对不同数据进行敏感级别的划分。根据私有、受控、公开的数据的管理形式划分不同级别,
4
以确保数据价值可以得到合理的评估以及数据安全可以得到合理的保障。并按照数据集的保密性情况进行分级划分以确保数据集的安全保障。本标准与国内多家单细胞及数据库相关企事业单位联合制定,旨在协调统一数据格式标准,并且会持续联合上述及更多新加入涉及的机构单位共同协调和遵循统一的数据格式标准,为单细胞相关数据产业做出行业贡献和科学数据保障。
3、协作单位
计划下达后,由深圳华大生命科学研究院成立了标准编制工作组。
4、标准编制过程和主要工作过程
(1)2022年11月至2022年12月,标准起草单位组织相关技术人员对《单细胞测序单细胞转录组数据集》标准项目进行了预研,课题组成员广泛收集了国内外单细胞及转录组数据相关标准、文献,了解了国内外相关技术动态,并且明确了工作思路和进程安排。
(2)2022年12月,标准起草单位组织相关技术人员对《单细胞测序单细胞转录组数据集》标准项目进行了全国生化检测标准化技术委员会数据及数据库工作组2022年第二次工作组会议研制进展的研讨。
(3)2024年4月,收到全国生化检测标准化技术委员会生检标【2024】5号文件《关于下达2024年第一批推荐性国家标准计划的通知》以及该标委会转发的国标委发【2024】16号《国家标准化管理委员会关于下达2024年第一批推荐性国家标准计划及相关标准外文版计划的通知》立项文件,计划编号T-469。
(4)2024年4月至2024年11月,进行《单细胞测序单细胞转录组数据集》标准的起草研制工作。完成了《单细胞测序单细胞转录组数据集》标准的草案,并对全国生化检测标准化技术委员会数据及数据库工作组汇报了《单细胞测序单细胞转录组数据集》
标准(草案)情况,与会专家就标准(草案)进行了讨论,提出了宝贵的意见和建议。标准起草小组根据专家意见进行了修改和完善。之后,向全国生化检测标准化技术委员会汇报了标准(草案)情况,委员会专家对标准(草案)提出了宝贵的意见和建议。
(5)2024年11月至2025年5月,标准起草小组对标准草案