ICS07.080C04
SZDB/Z
深圳市标准化指导性技术文件SZDB/Z92—2014
生物基因信息数据库建设与管理规范
2014-01-23发布2014-02-01实施
深圳市市场监督管理局发布
I
SZDB/Z92—2014
目次
前言 Ⅱ
引言 Ⅲ
1范围 1
2规范性引用文件 1
3术语与定义 1
4缩略语 4
5生物基因信息数据库建设规划 4
6数据库机构 5
7数据库管理 5
8硬件设备要求 11
II
SZDB/Z92—2014
前言
本标准按照GB/T1.1—2009给出的规则起草。
本标准由深圳市经济贸易和信息化委员会归口。
本标准负责起草单位:深圳华大基因研究院、深圳市标准技术研究院。
本标准主要起草人:张勇、严志祥、操利超、陈凤珍、肖萍、袁翠红、陈欢。本标准为首次发布。
III
SZDB/Z92—2014
引言
生物基因信息数据是21世纪的重要战略资源,生物基因信息数据库是促进生物基因数据共享和利用的重要基础平台,也是保护重要基因数据资源的有效手段。
随着人类基因组测序计划的完成,基因测序技术得到快速发展,特别是第二代高通量测序技术的出现,产生了大量的生物基因信息数据。西方发达国家一般都拥有具有代表性的生物基因信息数据库,如美国国家生物技术信息中心管理的核酸序列数据库、欧洲生物信息学研究所管理的核酸序列数据库及日本国家遗传学研究所管理的核酸序列数据库。在我国,虽然生物基因信息数据库的建设在快速发展,但是大多数生物基因信息数据库的数据量属于中小规模水平。目前国内还没有针对性的国家标准、行业标准和地方标准,导致在搜集和整理基因数据资源时缺乏依据,在建设生物基因信息数据库时难以保证数据的准确性、完整性和安全性。因此,利用标准化手段,制定生物基因信息数据库建设规范,可更好的指导基因信息数据库规范化建设,促进基因数据资源的共享和利用,助推我国生物产业快速健康发展。
1
SZDB/Z92—2014
生物基因信息数据库建设与管理规范
1范围
本标准规定了与生物基因信息数据库建设相关的设备、环境的基本要求以及生物信息数据的处理方法和原则。
本标准适用于生物基因信息数据库的建设,以及生物基因信息数据的采集、处理、存储、备份和使用。
2规范性引用文件
下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅所注日期的版本适用于本文件。凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。
GB
50052-2009
供配电系统设计规范
GB
50054-2011
低压配电设计规范
GB
50057-2010
建筑物防雷设计规范
GB
50116-1998
火灾自动报警系统设计规范
GB
50174-2008
电子信息系统机房设计规范
GB
50189-2005
公共建筑节能设计标准
GB
50222-1995
建筑内部装修设计防火规范
GB
50243-2002
通风与空调工程施工质量验收规范
GB
50254-1996
电气装置安装工程低压电器施工及验收规范
GB
50311-2007
综合布线系统工程设计规范
GB/T50314-2006智能建筑设计标准
GB50370-2005气体灭火系统设计规范
SJ/T10796-2001防静电活动地板通用规范YD/T1095-2008通信用不间断电源(UPS)
3术语与定义
下列术语和定义适用于本文件。3.1
比对alignment
指将两个或多个序列排列在一起,标明其相似之处。序列中可以插入间隔(通常用短线“-”表示)。对应相同或相似的符号(在核酸中是A、T(或U)、C和G,在蛋白质中是氨基酸残基的单字母表示)排列在同一列上。
3.2
期望值E-value
2
SZDB/Z92—2014
比对软件中使用的统计值,表示因为随机性而获得等于或优于当前比对结果的可能次数。E值越小,随机发生这一事件的可能性越小,比对结果越显著。
3.3
P值P-value
比对软件中使用的统计值,表示因为随机性而获得等于或优于当前比对结果的可能性。P值越小,比对结果的可信度越大,P值越大,比对结果来自随机匹配的可能性越大。
3.4
读长readlength
高通量测序仪产生的序列标签的长度。3.5
重叠群contig
基因组测序过程中将多个短的序列片段拼接成较长的连续片段。3.6
支架scaffold
基因组测序过程