基本信息
文件名称:个人学习课程心得体会五篇___.docx
文件大小:37.65 KB
总页数:3 页
更新时间:2025-10-20
总字数:约1.1千字
文档摘要

在实际操作中,我们发现《Python数据分析实战》课程最具挑战性。课程中,我们使用了一个包含10万条记录的电商平台销售数据集,数据字段包括商品ID、销售日期、价格、销量、用户评分等20个维度。课程要求我们完成从数据清洗到模型构建的全流程。具体来说,需要处理缺失值,我们发现价格字段有3.2%的缺失,采用了同类别商品均价填充的方法;然后处理异常值,通过箱线图识别并修正了127条销量异常记录。

对于数据可视化部分,我们使用Matplotlib和Seaborn库绘制了月度销售趋势图、商品类别分布饼图以及价格与销量的散点图。最关键的建模环节,我们分别尝试了线性回归、随机森林和XGBoost三种算法,最终