Python数据分析基础与应用
模块
PAGE2
PAGE21
模块2数据分析应用Python
【学习与训练】
2.1Python的编码规范与命名要求
1.Python的主要特点
Python的主要特点如下:
(1)Python是一种解释型编程语言,Python语言语法和结构相对简单,便于专注于数据分析的新手快速掌握。
(2)Python语言拥有与数据分析相关的大量开源库和分析框架,可直接使用,非常方便。
(3)Python其实不是只能用于数据分析,它还有很多其他方面的用途。
2.Python3默认的编码格式与字符所占的字节数
在默认情况下,Python3源码文件以UTF-8编码,所有字符串都是unicode字符串。当然也可以为源码文件指定不同的编码格式。
Python中,不同类型的字符所占的字节数也不同,数字、英文字母、小数点、下划线、空格等半角字符只占一个字节;汉字在GB2312/GBK编码中占2个字节,在UTF-8/Unicode中一般占用3个字节。
3.Python的编码规范
Python基本的编码规范如下:
①每个import语句只导入一个模块,尽量避免一次导入多个模块。
②不要在行尾添加分号“;”,也不要使用分号“;”将两条语句写在同一行。
③建议每行不超过80个字符,如果超过,建议使用小括号“()”将多行内容隐式的连接起来,而不推荐使用反斜杠“\”进行连接。
④使用必要的空行可以增加代码的可读性。一般在函数或者类的定义之间空两行,而类内方法定义之间空一行。另外,在用于分隔某些功能的位置也可以空一行。
⑤通常情况下,运算符两侧、函数参数之间、逗号“,”两侧都建议使用一个空格进行分隔。
⑥尽量避免在循环结构中使用“+”和“+=”运算符累加字符串。推荐将每个子字符加入列表,然后在循环结束后使用join()方法连接列表。
⑦适当使用异常处理结构提高程序容错性,但不能过多依赖异常处理结构,适当的显式判断一觉是必要的。
2.2Python转义字符与注释
2.2.1Python转义字符
在需要在字符中使用特殊字符时,Python使用反斜杠(\)表示转义字符。
例如:使用横向制表符\t和换行符\n将一行变成多行输出,且添加空白:
print(\tI\n\tlove\n\tPython)
运行结果如下:
I
love
Python
如果不想让反斜杠发生转义,可以在字符串前面添加一个r,表示原始字符串原样输出,不会发生转义。这里的r指raw,即rawstring。
例如:
print(D:\some\name)
执行结果如下:
D:\some
ame
print(rD:\some\name)
执行结果如下:
D:\some\name
另外,反斜杠可以作为续行符,在每行最后一个字符后使用反斜线来表示下一行是上一行逻辑上的延续,例如:
bookData=[1,HTML5+CSS3移动Web开发实战,58.00,\
50676377587,人民邮电出版社]
print(bookData)
执行结果如下:
[1,HTML5+CSS3移动Web开发实战,58.00,50676377587,人民邮电出版社]
还可以使用…或者…跨越多行。使用三引号时,换行符不需要转义,它们会包含在字符串中。
2.2.2Python程序的注释
注释是指在代码中对代码功能进行解释说明的提示性内容,可以提高代码的可读性。注释的内容将被Python解释器忽略,并不会在运行结果中体现出来。
在Python中,通常包括两种类型的注释,分别是单行注释和多行注释。
2.3Python3数据类型及其应用
Python3中有6个标准的数据类型:Numbers(数值)、String(字符串)、List(列表)、Tuple(元组)、Sets(集合)、Dictionaries(字典)。其中,不可变数据有3个,包括Number(数值)、String(字符串)、Tuple(元组);可变数据有3个,包括List(列表)、Dictionary(字典)、Set(集合)。
2.3.1Python3的数值类型
Python数值型数据类型用于存储数字形式的数值,就像大多数编程语言一样,数值类型的赋值和计算都是很直观的。Python3中数值型类型可以细分为4种:int(整数,如3)、float(浮点数,如1.23、3E-2)、complex(复数,如1+2j、1.1+2.2j)和bool(布尔型,如True)。
2.3.2Python字符串操作与计算
Python不支持单字符类型,单字符在Python中也是作为一个字符串使用,一个字符就是长度为