基本信息
文件名称:Python数据分析与可视化(第2版) 课件4.3 数据的分组与分段.pptx
文件大小:401.84 KB
总页数:26 页
更新时间:2025-07-11
总字数:约1.73千字
文档摘要

第4章利用pandas进行数据分析;在数据分析时,对数据进行分组和分段是常用的一种操作,通过分组和分段可以挖掘出更多数据的内在信息。

数据分组的作用是可以快速对所有分组进行统计计算,比如计算男女学生的平均成绩时,可以先按性别分组,然后再按成绩统计各组的平均数。;数据分段作用在于可以将连续的数据离散化,比如将成绩分为不同的成绩等级,将年龄分为不同的年龄段,这样就可以通过不同数据段的统计分析挖掘出一些更加有用的信息。;分组是指将DataFrame按照某列划分为多个不同的组,然后再按另外一列计算每组的一些统计指标,这一点类似于Excel的分类汇总,分组统计时只要确定分组字段、统计字段和统计方法就可