第12章数据库、数据仓库与数据挖掘;;12.1数据库基础;12.1.1数据库的基本结构;12.1.2数据库的特点;12.1.3数据模型;12.1.4数据库的发展;12.2数据仓库;12.2.1数据仓库的特点;12.2.2数据仓库与数据库;12.3数据挖掘;作为知识发现过程的一个特定步骤,数据挖掘是一系列技术及应用,或者说是对大容量数据及数据间关系进行考察和建模的方法集。它的目标是将大容量数据转化为有用的知识和信息。
知识发现是一个多步骤的对大量数据进行分析的过程,包括数据预处理、模式提取、知识评估及过程优化。知识获取往往需要经过多次的反复,通过对相关数据的再处理及知识发现算法的优化,不断提高学习效率。如在分析影响信用风险的因素时,可能先假设几种可能的因素,然后通过不断反复的实验,不断增加或删除因素,最终得到对信用风险最具影响的因素。
数据仓库是一种存储技术,它的数据存储量是一般数据库的100倍,它包含大量的历史数据、当前的详细数据以及综合数据,它能为不同用户的不同决策需要提供所需的数据和信息。而数据挖掘是从人工智能机器学习中发展起来的,它研究各种方法和技术,从大量的数据中挖掘出有用的信息和知识。
数据仓库完成数据的收集、集成、存储、管理等工作,数据挖掘面对的是经初步加工的数据,使得数据挖掘能更专注于知识的发现。又由于数据仓库所具有的新特点,对数据挖掘技术提出了更高的要求。另一方面,数据挖掘为数据仓库提供了更好的决策支持,同时促进了数据仓库技术的发展。可以说,数据挖掘和数据仓库技术要充分发挥潜力,就必须结合起来。
;数据挖掘和数据仓库的联系可以概括为如下几点。
1.数据仓库为数据挖掘提供了更好的、更广泛的数据源
2.数据仓库为数据挖掘提供了新的支持平台
3.数据仓库为更好地使用数据挖掘工具提供了方便
4.数据挖掘为数据仓库提供了更好的决策支持
5.数据挖掘对数据仓库的数据组织提出了更高的要求
6.数据挖掘还为数据仓库提供了广泛的技术支持
;