基本信息
文件名称:大数据技术与产业发展手册.docx
文件大小:46.86 KB
总页数:37 页
更新时间:2026-03-22
总字数:约2.43万字
文档摘要
大数据技术与产业发展手册
第1章数据基础与技术概述
1.1数据分类与特征
数据是信息的载体,其本质是结构化或非结构化的符号集合。根据不同的维度,数据可以分为结构化数据(如关系型数据库中的表格)、非结构化数据(如文本、图像、音频、视频)和半结构化数据(如JSON、XML格式)。数据特征通常包括数据量、数据质量、数据时效性、数据完整性、数据关联性等。例如,电商平台上用户行为数据具有高时效性和强关联性,而医疗数据则更注重数据完整性与准确性。
数据分类方法包括按数据类型(结构化/非结构化/半结构化)、按数据来源(内部/外部)、按数据用途(分析/决策/交互)等。例如,金融行业常用结构化数