基本信息
文件名称:数据仓库原理与实践 课件 第5章 数据集成与存储.pptx
文件大小:641.81 KB
总页数:18 页
更新时间:2025-03-09
总字数:约小于1千字
文档摘要
第5章数据集成与存储;5.1大数据来源;引例思考;大数据来源;;大数据按照数据结构可以分为结构化数据、半结构化数据和非结构化数据三大类。
(1)结构化数据是指可以以固定格式存储、访问和处理的数据。它通常遵循严格的数据格式与长度规范,并通过关系型数据库进行存储和管理。
(2)半结构化数据是介于结构化数据和非结构化数据之间的一种数据类型。它具有一定的结构性,但这种结构并不严格遵循关系型数据库的表结构,而是以一种更加灵活的方式组织数据。
(3)非结构化数据是指数据结构不规则或不完整,没有预定义的数据模型,不方便用数据库二维逻辑表来表现的数据。
;数据采集;数据采集概述;数据采集流程;数据采集组件;数据集成;数据集成概述;数据集成应用;数据存储;数据存储类型;数据存储格式;数据压缩格式及算法