基本信息
文件名称:样本数据处理许桂秋课后习题答案.docx
文件大小:63.85 KB
总页数:18 页
更新时间:2026-01-03
总字数:约6.87千字
文档摘要

第1章数据预处理概述

(1)简述数据预处理的方法和内容。

(2)有如下不完整的原始数据集:

客户编号

客户名称

风险等级

收入

1

张三

3

5000

2

李四

2

8000

3

王五

2

10000

4

赵六

1

15000

5

李木

1

6

王权

1

16000

1.请简述数据清洗的作用。

2.请使用数据清洗中多种常用的方法来填充表中的空缺值。

略。

(3)数据清洗主要目的是什么?

现实世界的数据一般是不完整的、有噪声的和不一致的。数据清洗试图填充缺失值、光滑噪声和识别离群点,并纠正数据中的不一致。

习题答案第1页,共11页

第2章Kettle工具的初步使用

(1)什么是