;7.1Nmupy应用
7.2pandas应用
7.3matplotlib应用
7.4pyecharts应用
;Numpy是外部库。这里所说的“外部”是指不包含在标准版Python中。因此,我们首先要导入Numpy库(importnumpyasnp)。;1.创建Numpy数组;2.NumPy数组的算术运算;NumPy数组广播;3.索引;4.聚合;1创建二维数组(矩阵)
2.矩阵算术运算
;数组广播
;算术运算和矩阵运算的一个关键区别是矩阵乘法使用点乘。
;3.矩阵索引和切片
;4.矩阵聚合
;5.转置和重塑
;ndarray对象
;ndarray创建函数及描述
;ndarray基本属性及描述
;ndarray类的处理数组形状方法及描述
;numpy常用统计函数及描述
;7.1Nmupy应用
7.2pandas应用
7.3matplotlib应用
7.4pyecharts应用
;Pandas是外部库。这里所说的“外部”是指不包含在标准版Python中。因此,我们首先要使用语句“importpandasaspd”导入Panda库。;1.Series
(1)Series的创建
语法格式为:pd.Series(list,index=[]),第二个参数是Series中数据的索引
使用数字序列作为索引创建Series。
;当要创建带有一个可以对各个数据点进行标记的索引的Series。
;使用字典创建Series
;(2)Series类型的操作
Series类型索引、切片、运算的操作(如根据布尔型数组进行过滤、标量乘法、应用数学函数等)类似于ndarray。
(1)根据标签索引的方式选取Series中的单个或一组值的,实例如下:
;(2)Series运算示例如下:;(2)Series运算示例如下:;(3)还可以将Series看成是一个定长的有序字典,类似Python字典类型的操作,它可以用在许多原本需要字典参数的函数中,例如保留字in操作和.get()方法等。;(4)Series有一个重要功能,就是在算术运算中会根据运算的索引标签自动对齐数据。;2.DataFrame
(1)DataFrame的创建
pd.DataFrame(data,columns=[],index=[]):columns和index为指定的列、行索引,并按照顺序排列。;(2)DataFrame的索引和值;(3)查询DataFrame
如果只查询一行、一列,返回的是pd.Series
查询一列,返回的是pd.Series,;查询一行,返回的是pd.Series,;如果查询多行、多列,返回的是pd.DataFrame
查询多列;修改DataFrame
添加列,直接赋值的方法,;df.apply()方法;df.assign()方法,它可以同时新增多个列;按条件选择分组分别赋值;添加行
? 在loc位置增加一行;??据追加合并df.append(),将其他行附加到调用方的末尾,并返回一个新对象;pd.concat(),指的是多表之间的“拼接”,;根据行索引删除;根据列名删除;修改列;修改行;1.读取数据
(1)读取文本文件:
读取csv数据集文件:pd.read_csv(filepath_or_buffer,header,names),文件名参数——filepath_or_buffer。
读取txt文件
(2)读取xlsx格式或Excel文件
;2.写入文件
;3.数据选取
(0)读取数据
(1)df.loc[行标签,列标签]方法,根据行、列的标签值查询
使用单个label值查询数据
使用值列表批量查询
使用数值区间进行范围查询(既包含开始也包含结束)
行index按区间查询。
列index按区间查询。
行和列index都按区间查询。
使用条件表达式查询(bool列表的长度等于行数或列数)
调用函数查询:直接写lambda表达式
;(2)df.iloc方法,根据行,列的数字位置查询
行或者列,都可以只传入单个值,实现精确匹配
行只传入单个值,iloc提取行数据
列只传入单个值,iloc提取列数据
iloc提取指定行、指定列数据
使用值列表批量查询调用函数查询
使用数值区间进行切片
行index按区间查询
列index按区间查询
行和列index都按区间查询
调用函数查询:直接写lambda表达式
;;(3)df.where方法
df.where(cond)可以过滤不满足cond的值并赋予NaN空值
df.where(cond,other)赋予other值得用法
df.where从主体df出发,True返回df本身的值,否则返回other的值;
去掉特定的某行某列
;(4)df.query方法
使用布尔