基本信息
文件名称:样本数据处理许桂秋课后习题答案.docx
文件大小:63.85 KB
总页数:18 页
更新时间:2026-01-03
总字数:约6.87千字
文档摘要
第1章数据预处理概述
(1)简述数据预处理的方法和内容。
(2)有如下不完整的原始数据集:
客户编号
客户名称
风险等级
收入
1
张三
3
5000
2
李四
2
8000
3
王五
2
10000
4
赵六
1
15000
5
李木
1
6
王权
1
16000
1.请简述数据清洗的作用。
2.请使用数据清洗中多种常用的方法来填充表中的空缺值。
略。
(3)数据清洗主要目的是什么?
现实世界的数据一般是不完整的、有噪声的和不一致的。数据清洗试图填充缺失值、光滑噪声和识别离群点,并纠正数据中的不一致。
习题答案第1页,共11页
第2章Kettle工具的初步使用
(1)什么是