基本信息
文件名称:湖南大学《软件技术基础》ppt课件 第9章 网络新技术.pptx
文件大小:3.08 MB
总页数:39 页
更新时间:2025-07-06
总字数:约6.81千字
文档摘要
第9章网络新技术;;;1.数据分类
根据数据的生成方式和结构特点不同,可将数据划分几类:
(1)结构化数据
结构化数据主要指数据库中的数据。结构化数据一直是传统数据分析的重要研究对象,目前主流的结构化数据管理工具,如关系型数据库等,都提供了数据分析功能。
结构化数据的分析方法较为成熟,大部分都以数据挖掘和统计分析为基础。
(2)文本
文本是常用的存储文字、传递信息的方式,也是最常见的非结构化数据。例如电子邮件、文件等。文本分析被认为比结构化数据挖掘更具有商业化潜力。通常情况下,文本分析也称为文本挖掘,指的是从非结构化文本中提取有用信息和知识的过程。文本挖掘是一个跨学科领域,涉及到信息检索、