基本信息
文件名称:数据仓库的开发流程.ppt
文件大小:8.01 MB
总页数:53 页
更新时间:2025-09-01
总字数:约4.3千字
文档摘要

逻辑模型设计分析主题域确定粒度层次划分确定数据分割策略关系模式定义数据源及抽取模型的定义第29页,共53页,星期日,2025年,2月5日分析主题域对概念模型设计步骤中确定的几个基本主题域进行分析,选择首先要实施的主题域;如果所选择的主题域很大并且很复杂,我们甚至可以针对它的一个有意义的子集来进行开发;商场数据仓库设计的例子:

“商品”主题既是一个商场的最基本的业务对象,又是进行决策分析的最主要的领域,因而较之另两个主题来说,“商品”主题具有更重要的意义与作用。所以,我们可以先选定“商品”主题来实施。第30页,共53页,星期日,2025年,2月5日粒度层次划分粒度层次划分适当与否直接影响到数据仓库中的数据量和所适合的查询类型;通过估算数据行数和所需的DASD数,确定采用单一粒度或多重粒度,以及粒度划分的层次。

DASD(DirectAccessStorageDevice)例子:商品主题--多重粒度第31页,共53页,星期日,2025年,2月5日数据分割策略数据量的大小是决定是否进行数据分割和如何分割的主要因素;数据分析处理的要求是选择数据分割标准的一个主要依据;还要考虑到所选择的数据分割标准应是自然的、易于实施的;同时也要考虑数据分割的标准与粒度划分层次是适应的。第32页,共53页,星期日,2025年,2月5日关系模式定义由多个表实现;对于多维数据模型:事实表和维度表;

对于E-R模型:主题的相关信息的内容表

如,商品主题的关系模式定义包括:

商品固有信息、商品采购信息、商品销售信息、商品库存信息、其它数据等。第33页,共53页,星期日,2025年,2月5日数据源及抽取模型的定义由三种表实现;数据源抽取对象表;

数据源抽取规则表;

数据目标列与源列对应关系表。第34页,共53页,星期日,2025年,2月5日数据仓库的设计步骤概念模型设计技术准备工作逻辑模型设计物理模型设计数据仓库生成数据仓库使用与维护第35页,共53页,星期日,2025年,2月5日物理模型设计工作:确定数据的存储结构,确定索引策略,确定数据存放位置,确定存储分配。前提要求:

1.全面了解所选用的数据库管理系统,特别是存储结构和存取方法。

2.了解数据环境、数据的使用频度、使用方式、数据规模以及响应时间要求等,这些是对时间和空间效率进行平衡和优化的重要依据。

3.了解外部存储设备的特性,如分块原则,块大小的规定,设备的I/O特性等。第36页,共53页,星期日,2025年,2月5日数据仓库的设计步骤概念模型设计技术准备工作逻辑模型设计物理模型设计数据仓库生成数据仓库使用与维护第37页,共53页,星期日,2025年,2月5日数据仓库的生成工作:接口编程,数据装入;成果:数据已经装入到数据仓库中,可以在其上建立数据仓库的应用,即DSS应用。第38页,共53页,星期日,2025年,2月5日第1页,共53页,星期日,2025年,2月5日数据库系统的开发流程需求收集和分析设计概念结构设计逻辑结构数据模型优化设计物理结构设计评价性能预测物理实现实验性运行使用维护数据库不满意需求分析阶段概念设计阶段逻辑设计阶段物理设计阶段数据库实施阶段数据库运行维护阶段不满意第2页,共53页,星期日,2025年,2月5日数据库设计流程的特点有明确的应用需求;严格遵循系统生命同期的阶段划分,较清楚的设计开发步骤;良好的可操作性,每一步骤的任务、文档内容与格式有细致的规定。举例:项目文档第3页,共53页,星期日,2025年,2月5日数据库设计举例1.需求分析

(沟通、会议演示、软件需求说明书)

2.系统概念设计

(系统功能结构、流程、数据结构等)

3.系统详细设计

(E-R、功能模块、界面、业务过程、接口)

5.系统实现

(数据库实现、程序实现)

4.系统测试与实施第4页,共53页,星期日,2025年,2月5日数据库与数据仓库设计的区别第5页,共53页,星期日,2025年,2月5日数据仓库开发流程的特点原始需求不明确,且不断变化与增加,不能较准确地预见到以后的需求;采用原型法开发,从构建系统的简单的基本框架着手;数据驱动,着眼于有效地抽取、综合、集成和挖掘已有数据库的数据资源。第6页,共53页,星期日,2025年,2月5日原型法原型(Prototype)是开发信息系统的一个可执行模型或引导性版本;帮助得到目标系统明确而严格的需求,促进客户和各阶段系统人员之间的相互有效的信息交流,并以此为基础进行需求分析和系统设计。从本质上看,原型是未来目标系统的一个模型。第