基本信息
文件名称:2025年征信数据分析挖掘工程师认证考试题库精选.docx
文件大小:38.98 KB
总页数:9 页
更新时间:2025-07-10
总字数:约4.25千字
文档摘要

2025年征信数据分析挖掘工程师认证考试题库精选

考试时间:______分钟总分:______分姓名:______

一、数据预处理

要求:对给定的数据集进行预处理,包括数据清洗、数据集成、数据变换和数据规约,并解释每一步骤的目的和操作。

1.假设你有一个包含以下列的CSV文件:客户ID、年龄、性别、收入、信用卡使用情况、逾期记录。请说明以下数据清洗步骤的目的和操作:

a.删除缺失值。

b.处理异常值。

c.处理重复记录。

2.假设你有一个包含以下列的CSV文件:客户ID、年龄、性别、收入、信用卡使用情况、逾期记录。请说明以下数据集成步骤的目的和操作: