基本信息
文件名称:数据挖掘:特征工程:特征选择方法论.docx
文件大小:31.18 KB
总页数:21 页
更新时间:2025-08-24
总字数:约1.68万字
文档摘要
PAGE1
PAGE1
数据挖掘:特征工程:特征选择方法论
1数据挖掘概述
1.1数据挖掘的基本概念
数据挖掘(DataMining)是一种从大量数据中提取有用信息的过程,这些信息可以是模式、关联、趋势或异常。数据挖掘不仅仅是一种技术,它是一个多步骤的流程,涉及数据清洗、数据集成、数据转换、数据挖掘、模式评估和知识表示等阶段。数据挖掘的目标是从数据中发现隐藏的知识,以支持决策制定。
1.1.1示例
假设我们有一组销售数据,包含产品ID、销售日期、销售数量、客户ID和客户年龄等信息。数据挖掘可以用来分析哪些产品在特定季节销售得更好,或者哪些年龄段的客户更倾向于购买特定类型