基本信息
文件名称:Python大数据分析与挖掘实战:微课版(第2版)课件 第1章 Python基础;第2章 科学计算包Numpy.pptx
文件大小:1.54 MB
总页数:67 页
更新时间:2025-06-17
总字数:约3.04千字
文档摘要

;Python基本数据类型;Python基本数据类型;Python基本数据类型,即对单个数值和文本进行了定义。然而,真实数据集是由多个数值或多个文本组成的,其数据集形态可能是二维表(比如Excel表格),也可能是某一列(数据序列)。以某个数据序列为例,如何进行组织和存储呢?——Python基本数据结构;列表作为Python中一种数据结构,可以存放不同类型的数据,用中括号括起来进行定义。

;元组与列表类似,也是Python中一种常用数据结构,不同之处在于元组中的元素不能修改,元组采用圆括号括起来进行定义。

;

集合也是Python中的数据结构,是一种不重复元素的序列,用大括号括起来进行定义。

;字典是一种按键、值对定义的数据结构,其中键必须唯一,用大括号括起来进行定义。字典中的元素由键和值两部分组成,键在前值在后,键和值之间用冒号(:)来区分,元素之间用逗号隔开。键可以是数值、字符,值可以是数值、字符或者其他Python数据结构(比如列表、元组等)。

;Python基本数据结构之间比较;;Python相关公有方法;索引;

切片是指定索引位置,对数据实现分块访问或提取的一种数据操作方式。

下面简单介绍字符串、列表、元组的切片方法。

;

字符串的长度为字符串中所有字符的个数,其中空格也算一个字符;列表、元组、集合的长度,即为元素的个数;字典的长度为键的个数,用函数len()来实现

;统计包括求最大值、最小值、求和等,可以是列表、元组、字符串;

成员身份的确认,用in命令,用来判断某个元素是否属于指定的数据结构变量。

;

程序运行过程中,可以存在大量的中间变量,这些变量一来占用空间,二来影响可读性,可以使用del命令删除不必要的中间变量。

;;预定义几个列表;

2.添加元素:append()

;

3.扩展列表:extend()

;

5.返回下标:index()

;

7.元素排序:sort()

;预定义两个元组

T1=(1,2,2,4,5)

T2=(H2,3,KL)

创建空元组:tuple()

t1=tuple()#产生空元组

t=()#产生空元组;T1=(1,2,2,4,5)

T2=(H2,3,KL)

2.元素计数:count()

print(元素2出现的次数为:,T1.count(2))

执行结果如下:

元素2出现的次数为:2

3.返回下标:index()

print(KL的下标索引为:,T2.index(KL))

执行结果如下:

KL的下标索引为:2;字符串作为基本的数据类型,也可以看作一种特殊的数据结构字符从0开始进行索引编号,包括空格特特殊字符;2.查找子串:find()

用find函数查找子串出现的开始索引位置,如果没有找到则返回-1。

st=helloword!‘

z1=st.find(he,0,len(st))#返回包含子串的开始索引位置,否则-1

z2=st.find(he,1,len(st))

print(z1,z2)

执行结果为:

0-1

其中find函数第一个参数为需要查找的子串,第二个参数是待查字符串指定的开始位置,第三个参数为指定待查字符串的长度。

;3.替换子串:replace()

st=helloword!‘

stt=st.replace(or,kl)#原来的st不变

print(stt)

print(st)

执行结果如下:

hellowkld!

helloword!

4.字符串连接

st1=joh

st2=st1++st

print(st2)

执行结果如下:

johhelloword!

;

5.字符串比较

;字典方法;字典方法;;条件语句;条件语句;条件语句;条件语句;循环语句;循环语句;函数;函数;函数;;Numpy简介;利用array()函数创建数组;利用内置函数创建数组;数组尺寸与重排;第2章;第2章;第2章;第2章;第2章;第2章;第2章;

数组展平

;

数组排序

;

数组搜索

;;矩阵创建;矩阵创建;矩阵基本属性(转置、共轭、逆矩阵)

importnumpyasnp

mat=np.matrix(np.arange(4).reshape(2,2))

mT=mat.T

mH=mat.H

mI=mat.I

;importnumpyasnp

mat1=np.mat(123;456;789)

mat2=mat1*3

mat3=mat1+mat2

mat4=mat1-mat2

mat5=mat1*mat2

mat6=np.