基本信息
文件名称:大数据技术及应用——基于Python语言 习题解答:第3章 大数据采集与预处理.docx
文件大小:247.83 KB
总页数:4 页
更新时间:2025-08-28
总字数:约1.63千字
文档摘要

大数据采集与预处理

一、选择题

1.按产生数据的主体来划分,大数据主要有三个来源,它们分别是(B)。

信息管理系统的记录、计算机产生的数据和对现实世界的测量

对现实世界的测量、人类的记录和计算机产生的数据

对现实世界的测量、人类的记录和物联网监测的数据

对现实世界的测量、传感器采集的数据和计算机产生的数据

2.以下哪项处理是属于数据集成要完成的工作(D)。

数据平滑

标准化处理

去除噪声

实体识别

3.以下哪项不属于数据预处理中去除噪声的方法(C)。

分箱

移动平均

归一化

3σ探测方法

4.假设有12个从小到大的有序数据:5,10,11,13,15,35,50,55,72