基本信息
文件名称:2.3多表数据采集.pdf
文件大小:426.6 KB
总页数:11 页
更新时间:2025-03-26
总字数:约3.53千字
文档摘要

大数据财务分析

主讲:谢畅

爱岗敬业诚实守信坚持准则提高技能

廉洁自律客观公正参与管理强化服务

项目二数据采集

任务三多表数据采集

多表数据采集

一、DataFrame

1.DataFrame

DataFrame是二维数据结构,相当于Excel表格,每列值数据类型可以

不同。DataFrame既有行索引,也有列索引,常用于表达二维数据。

DataFrame是最常用的Pandas数据类型,也是财务数据在Python中

的最佳存储方式。

1)DataFrame的创建

DataFrame由器同名函数创建,语法如下:

Pd.DataFrame(data,columns=[序列],index=[序列])若不传入

columns和index参数,则默认为自动索引(从0开始)通常以二维数

据创建DataFrame

爱岗敬业诚实守信

多表数据采集

一、DataFrame

2.DataFrame的简单运算

DataFrame可以直接提取出行列数据进行加减乘除等运算。

df[‘资产负债率’]=df[‘负债总额’]/df[‘资产总额‘]

廉洁自律客观公正

多表数据采集

一、DataFrame

3.DataFrame的基本函数

DataFrame的操作函数有许多。

①rename()函数

rename()函数:对行索引及列重命名,修改列名传入columns参数、

修改行索引传入index参数。rename()函数适合用于修改个别索引或

列名,如需修改全部行列索引名,可直接对df.columns、df.index属

性重新赋值,但需注意的是,使用该方法必须对所有行索引或列索引

进行修改。

坚持准则提高技能

多表数据采集

一、DataFrame

3.DataFrame的基本函数

②insert()函数

insert()函数:将列插入DataFrame中的指定位置。Insert()函

数语法如下:

DataFrame.insert(loc,column,value,allow_duplicates=False)

loc:int,插入列的位置,表示第几列,插入第一列为loc=0

Column:插入列的列名

Value:插入的值,可选(int,Series,数组)

allow_duplicates:是否允许列名重复,默认为False,如果列名

已经存在则报错,设置为True表示允许列名重复。

参与管理强化服务

多表数据采集

一、DataFrame

3.DataFrame的基本函数

③drop()函数

labels:单个标签或标签列表