基本信息
文件名称:《大数据技术在财务中的应用》课件 4.2 数据清洗.pptx
文件大小:7.04 MB
总页数:16 页
更新时间:2025-11-21
总字数:约1.14千字
文档摘要
项目四搭建Python数据分析基础
任务二数据清洗
CONTENTS识别重复值、缺失值和异常值01处理重复值02处理缺失值03处理异常值04目录
PARTONE识别重复值缺失值和异常值
识别重复值缺失值和异常值
识别重复值缺失值和异常值写入函数to_excel()和读取函数read_excel()的参数设置比较类似。to_excel()函数写入单个工作表的常用参数如表所示。
识别重复值缺失值和异常值生成的“订单数据.xlsx”文件如表所示。订单数据样本显示存在典型数据质量问题:订单号100007688重复出现(重复值),0007691和100006685缺失城市ID和销售渠道信息(缺失值),