基本信息
文件名称:2025年大数据分析师职业技能测试卷:大数据分析与数据科学试题.docx
文件大小:39.65 KB
总页数:9 页
更新时间:2025-05-25
总字数:约6.26千字
文档摘要
2025年大数据分析师职业技能测试卷:大数据分析与数据科学试题
考试时间:______分钟总分:______分姓名:______
一、数据处理与数据清洗
要求:请根据以下数据集,完成数据的预处理工作,包括数据清洗、缺失值处理、异常值处理等。
1.数据集描述:以下是一份包含客户购买行为的CSV文件,包含字段:客户ID(ID)、购买日期(Date)、产品类别(Category)、购买金额(Amount)。
请根据以下要求进行数据处理:
(1)将购买日期转换为日期格式。
(2)去除购买金额为负数的记录。
(3)将客户ID中重复的记录合并。
(4)处理缺失值,对于缺失的购买日期和购买