Python 爬虫基础与实战课件第7章数据可视化.pptx

基本信息

文件名称：Python 爬虫基础与实战课件第7章数据可视化.pptx

文件大小：2.01 MB

总页数：106 页

更新时间：2025-03-22

总字数：约6.36千字

文档摘要

;7.1Nmupy应用

7.2pandas应用

7.3matplotlib应用

7.4pyecharts应用

;Numpy是外部库。这里所说的“外部”是指不包含在标准版Python中。因此，我们首先要导入Numpy库（importnumpyasnp）。;1.创建Numpy数组;2.NumPy数组的算术运算;NumPy数组广播;3.索引;4.聚合;1创建二维数组（矩阵）

2.矩阵算术运算

;数组广播

;算术运算和矩阵运算的一个关键区别是矩阵乘法使用点乘。

;3.矩阵索引和切片

;4.矩阵聚合

;5.转置和重塑

;ndarray对象

;ndarray创建函数及描述

;ndarray基本属性及描述

;ndarray类的处理数组形状方法及描述

;numpy常用统计函数及描述

;7.1Nmupy应用

7.2pandas应用

7.3matplotlib应用

7.4pyecharts应用

;Pandas是外部库。这里所说的“外部”是指不包含在标准版Python中。因此，我们首先要使用语句“importpandasaspd”导入Panda库。;1.Series

（1）Series的创建

语法格式为：pd.Series(list,index=[])，第二个参数是Series中数据的索引

使用数字序列作为索引创建Series。

;当要创建带有一个可以对各个数据点进行标记的索引的Series。

;使用字典创建Series

;（2）Series类型的操作

Series类型索引、切片、运算的操作（如根据布尔型数组进行过滤、标量乘法、应用数学函数等）类似于ndarray。

（1）根据标签索引的方式选取Series中的单个或一组值的，实例如下：

;（2）Series运算示例如下：;（2）Series运算示例如下：;（3）还可以将Series看成是一个定长的有序字典，类似Python字典类型的操作，它可以用在许多原本需要字典参数的函数中，例如保留字in操作和.get（）方法等。;(4)Series有一个重要功能，就是在算术运算中会根据运算的索引标签自动对齐数据。;2.DataFrame

（1）DataFrame的创建

pd.DataFrame(data,columns=[],index=[])：columns和index为指定的列、行索引，并按照顺序排列。;（2）DataFrame的索引和值;（3）查询DataFrame

如果只查询一行、一列，返回的是pd.Series

查询一列，返回的是pd.Series，;查询一行，返回的是pd.Series，;如果查询多行、多列，返回的是pd.DataFrame

查询多列;修改DataFrame

添加列,直接赋值的方法，;df.apply()方法;df.assign()方法，它可以同时新增多个列;按条件选择分组分别赋值;添加行

? 在loc位置增加一行;??据追加合并df.append()，将其他行附加到调用方的末尾，并返回一个新对象;pd.concat()，指的是多表之间的“拼接”，;根据行索引删除;根据列名删除;修改列;修改行;1.读取数据

（1）读取文本文件:

读取csv数据集文件:pd.read_csv(filepath_or_buffer,header,names)，文件名参数——filepath_or_buffer。

读取txt文件

（2）读取xlsx格式或Excel文件

;2.写入文件

;3.数据选取

(0)读取数据

(1)df.loc[行标签，列标签]方法，根据行、列的标签值查询

使用单个label值查询数据

使用值列表批量查询

使用数值区间进行范围查询（既包含开始也包含结束）

行index按区间查询。

列index按区间查询。

行和列index都按区间查询。

使用条件表达式查询（bool列表的长度等于行数或列数）

调用函数查询:直接写lambda表达式

;(2)df.iloc方法，根据行，列的数字位置查询

行或者列，都可以只传入单个值，实现精确匹配

行只传入单个值，iloc提取行数据

列只传入单个值，iloc提取列数据

iloc提取指定行、指定列数据

使用值列表批量查询调用函数查询

使用数值区间进行切片

行index按区间查询

列index按区间查询

行和列index都按区间查询

调用函数查询:直接写lambda表达式

;;(3)df.where方法

df.where(cond)可以过滤不满足cond的值并赋予NaN空值

df.where(cond,other)赋予other值得用法

df.where从主体df出发，True返回df本身的值，否则返回other的值；

去掉特定的某行某列

;(4)df.query方法

使用布尔