基本信息
文件名称:数据挖掘:特征工程:图像特征识别技术教程.docx
文件大小:31.75 KB
总页数:21 页
更新时间:2025-08-24
总字数:约1.73万字
文档摘要
PAGE1
PAGE1
数据挖掘:特征工程:图像特征识别技术教程
1数据挖掘概述
1.1数据挖掘的基本概念
数据挖掘(DataMining)是一种从大量数据中提取有用信息的过程,这些信息可以是模式、关联、趋势或异常。数据挖掘不仅仅是一种技术,它是一个涉及数据准备、模型构建、模型评估和结果部署的完整流程。数据挖掘的基本概念包括:
数据清洗:处理缺失值、噪声数据和不一致的数据,确保数据质量。
数据集成:将来自多个数据源的数据合并到一起,解决数据冗余和冲突。
数据转换:将数据转换成适合挖掘的形式,如归一化、离散化等。
数据挖掘:应用算法和模型来发现数据中的模式和知识。
模式评估