基本信息
文件名称:2025年征信数据挖掘工程师岗位认证:征信数据分析挖掘与信用风险实战试题.docx
文件大小:39.04 KB
总页数:6 页
更新时间:2025-05-22
总字数:约3.32千字
文档摘要
2025年征信数据挖掘工程师岗位认证:征信数据分析挖掘与信用风险实战试题
考试时间:______分钟总分:______分姓名:______
一、数据预处理
要求:请根据给出的数据集,完成数据清洗、缺失值处理、异常值处理、数据标准化等数据预处理工作。
1.数据集描述:
假设我们有一个名为“征信数据集”的数据文件,其中包含以下字段:身份证号、姓名、年龄、性别、婚姻状况、职业、收入、信用评分等。
2.题目要求:
(1)检查数据集中是否存在重复记录,如有,请删除。
(2)处理缺失值,对缺失的年龄、收入和信用评分字段,采用以下方法进行处理:
a.对于年龄字段,使用平均年龄进