1
T/JXEA131—2026
水产遗传育种数据库构建与共享规范
1范围
本文件规定了水产遗传育种数据库构建与共享的基本原则、总体要求、数据采集与预处理、数据库设计与构建、数据质量控制、数据共享与安全、运行维护与更新以及合规性与伦理要求。
本文件适用于水产遗传育种相关科研机构、高等院校、育种企业、种质资源库、技术服务机构等在构建、管理、维护和共享水产遗传育种数据库时的技术活动。
2规范性引用文件
下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本适用于本文件。
GB/T28827.1—2012信息技术服务运行维护第1部分:通用要求GB/T35295—2017信息技术大数据术语
GB/T36344—2018信息技术数据质量评价指标
GB/T37973—2019信息安全技术大数据安全管理指南
GB/T39725—2020信息安全技术健康医疗数据安全指南NY/T3055—2016水产种质资源描述规范
SC/T9412—2014水生生物种质资源收集、保存与描述规范ISO/IEC11179(所有部分)信息技术元数据注册系统
3术语和定义
下列术语和定义适用于本文件。
3.1水产遗传育种数据aquaculturegeneticandbreedingdata
与水产动物、植物遗传资源、育种材料、育种过程、性状测定、基因组信息、谱系记录等相关的数据集合,包括但不限于种质资源信息、表型数据、基因型数据、环境数据、管理记录等。
3.2数据预处理datapreprocessing
在数据入库前对其进行清洗、转换、集成、归约等一系列操作,以提高数据质量、统一数据格式、
2
T/JXEA131—2026
消除不一致性的过程。预处理的目的是提升数据的可用性与一致性,为后续分析与共享奠定基础。
3.3元数据metadata
描述数据的数据,用于说明数据的来源、结构、含义、关系、质量、管理方式等信息。元数据有助于用户理解数据背景、提高数据的可发现性和可重用性。
3.4数据共享datasharing
在符合法律法规和伦理要求的前提下,通过授权访问、接口服务、数据交换等方式,向授权用户提供数据资源的行为。共享机制的建立有助于促进科研协作、避免数据孤岛、提升资源利用效率。
3.5数据安全datasecurity
通过技术和管理措施,保护数据免受未经授权的访问、泄露、篡改、破坏或丢失的状态。数据安全是保障数据机密性、完整性与可用性的基础,尤其在涉及种质资源与遗传信息时尤为重要。
4数据库构建原则与总体要求
4.1基本原则
数据库结构设计、数据分类与编码、数据模型构建应遵循水产遗传育种学科规律与信息技术规范,确保数据的科学性与可解释性。数据采集、描述、存储、交换应遵循统一的标准和规范,保证数据的标准化与一致性。应尽可能全面地收集与整合各类相关数据,确保数据集的系统性和完整性,数据缺失率应低于5%。数据应真实、准确、可靠,关键数据项的误差率不得超过规定阈值。应建立完善的数据安全保护体系,确保数据的机密性、完整性和可用性,防止数据泄露、滥用和损坏。数据库架构应具备良好的扩展性,能够适应未来数据类型、数据量和应用需求的变化。
4.2总体要求
应设立专门的数据管理组织或指定专人负责数据库的规划、建设、运维与安全管理,明确各岗位职责。应选择稳定可靠、性能优良、符合主流技术趋势的数据库管理系统及硬件基础设施。支持主流的数据接口与通信协议。数据库构建应优先采用国家标准、行业标准及国际通用标准。无直接适用标准时,应制定内部规范并说明。数据库建设各阶段应编制并保存完整的技术文档、管理文档与操作手册,文档完整率应达到100%。
T/JXEA131—2026
3
5数据采集与预处理
5.1数据来源与类型
5.1.1数据来源
可包括实验室测定数据、田间试验数据、生产记录数据、历史文献数据、公共数据库数据、合作单位交换数据等。应记录数据来源的详细出处。
5.1.2数据类型
至少应包括:a)种质资源数据:品种/品系名称、来源、保存状态、生物学特性等;b)表型数据:生长性状、体型性状、抗性性状、品质性状等;c)基因型数据:分子标记数据、SNP数据、基因组序列数据、基因表达数据等;d)谱系与系谱数据:亲本信息、交配设计、家系关系等;e)环境数据:养殖环境参数、水质数据、地理位置等;f)管理与实验数据:饲养管理记录、实验处理信息、测定方法、仪器设备等。
5.2数据采集要求
应制定明确的数据采集流程,包括采集计划制定、采集工具准备、现场采集、