基本信息
文件名称:Python 爬虫基础与实战 课件 第7章 数据可视化.pptx
文件大小:2.01 MB
总页数:106 页
更新时间:2025-03-22
总字数:约6.36千字
文档摘要

;7.1Nmupy应用

7.2pandas应用

7.3matplotlib应用

7.4pyecharts应用

;Numpy是外部库。这里所说的“外部”是指不包含在标准版Python中。因此,我们首先要导入Numpy库(importnumpyasnp)。;1.创建Numpy数组;2.NumPy数组的算术运算;NumPy数组广播;3.索引;4.聚合;1创建二维数组(矩阵)

2.矩阵算术运算

;数组广播

;算术运算和矩阵运算的一个关键区别是矩阵乘法使用点乘。

;3.矩阵索引和切片

;4.矩阵聚合

;5.转置和重塑

;ndarray对象

;ndarray创建函数及描述

;ndarray基本属性及描述

;ndarray类的处理数组形状方法及描述

;numpy常用统计函数及描述

;7.1Nmupy应用

7.2pandas应用

7.3matplotlib应用

7.4pyecharts应用

;Pandas是外部库。这里所说的“外部”是指不包含在标准版Python中。因此,我们首先要使用语句“importpandasaspd”导入Panda库。;1.Series

(1)Series的创建

语法格式为:pd.Series(list,index=[]),第二个参数是Series中数据的索引

使用数字序列作为索引创建Series。

;当要创建带有一个可以对各个数据点进行标记的索引的Series。

;使用字典创建Series

;(2)Series类型的操作

Series类型索引、切片、运算的操作(如根据布尔型数组进行过滤、标量乘法、应用数学函数等)类似于ndarray。

(1)根据标签索引的方式选取Series中的单个或一组值的,实例如下:

;(2)Series运算示例如下:;(2)Series运算示例如下:;(3)还可以将Series看成是一个定长的有序字典,类似Python字典类型的操作,它可以用在许多原本需要字典参数的函数中,例如保留字in操作和.get()方法等。;(4)Series有一个重要功能,就是在算术运算中会根据运算的索引标签自动对齐数据。;2.DataFrame

(1)DataFrame的创建

pd.DataFrame(data,columns=[],index=[]):columns和index为指定的列、行索引,并按照顺序排列。;(2)DataFrame的索引和值;(3)查询DataFrame

如果只查询一行、一列,返回的是pd.Series

查询一列,返回的是pd.Series,;查询一行,返回的是pd.Series,;如果查询多行、多列,返回的是pd.DataFrame

查询多列;修改DataFrame

添加列,直接赋值的方法,;df.apply()方法;df.assign()方法,它可以同时新增多个列;按条件选择分组分别赋值;添加行

? 在loc位置增加一行;??据追加合并df.append(),将其他行附加到调用方的末尾,并返回一个新对象;pd.concat(),指的是多表之间的“拼接”,;根据行索引删除;根据列名删除;修改列;修改行;1.读取数据

(1)读取文本文件:

读取csv数据集文件:pd.read_csv(filepath_or_buffer,header,names),文件名参数——filepath_or_buffer。

读取txt文件

(2)读取xlsx格式或Excel文件

;2.写入文件

;3.数据选取

(0)读取数据

(1)df.loc[行标签,列标签]方法,根据行、列的标签值查询

使用单个label值查询数据

使用值列表批量查询

使用数值区间进行范围查询(既包含开始也包含结束)

行index按区间查询。

列index按区间查询。

行和列index都按区间查询。

使用条件表达式查询(bool列表的长度等于行数或列数)

调用函数查询:直接写lambda表达式

;(2)df.iloc方法,根据行,列的数字位置查询

行或者列,都可以只传入单个值,实现精确匹配

行只传入单个值,iloc提取行数据

列只传入单个值,iloc提取列数据

iloc提取指定行、指定列数据

使用值列表批量查询调用函数查询

使用数值区间进行切片

行index按区间查询

列index按区间查询

行和列index都按区间查询

调用函数查询:直接写lambda表达式

;;(3)df.where方法

df.where(cond)可以过滤不满足cond的值并赋予NaN空值

df.where(cond,other)赋予other值得用法

df.where从主体df出发,True返回df本身的值,否则返回other的值;

去掉特定的某行某列

;(4)df.query方法

使用布尔