一、写在前面
代码被阅读的次数远多于编写的次数。
我们可能花费很多时间来编写一段代码,一旦完成后大概率就再不会重新写它。当这段代码不仅是自己用时,就得注意了,每次自己或其他人浏览,需要快速知道它的作用及编写它的原因,因此可读性显得很重要,比如:
>>> a = "Cai Xukun"
>>> b, c = a.split()
>>> print(b, c, sep=', ')
看到这种脑阔痛。那么,每个人都有自己的编码风格,如何使整个团队趋于一致呢?Python PEP 8早已考虑到这种情况:https://peps.python.org/pep-0008/。
我们可能互相不清楚每个人的风格,但又必须阅读与理解各自产出的代码,那么此时遵循PEP 8会是优秀选择,也是每个Python从业者需要学习掌握的规范,一起看看吧!
二 、命名规范
编写代码时需要命名很多东西,如变量、函数、类等。选择合理的名称将节省以后的时间和精力,确保能够从名称中得到某个变量或函数代表的意义,不恰当的名称还会徒增调试难度。
Tip:切勿使用 l 、 O 或 I 单字母名称,因为这些名称可能会被误认为 1 和 0。
1.命名风格
以下是一些常见的命名约定以及如何使用示例,除了在代码中选择正确的命名样式之外,还必须仔细选择名称:
类型 | 命名约定 | 例子 |
Variable | 使用小写的单个字母、单词或单词,用下划线分隔单词 | x, var, my_variable |
Function | 使用一个或多个小写单词,用下划线分隔单词 | function, my_function |
Class | 每个单词都以大写字母开头,这种风格称为驼峰式命名法或帕斯卡式命名法 | Model, MyClass |
Method | 使用一个或多个小写单词,用下划线分隔单词 | class_method, method |
Constant | 使用大写的单个字母、单词或单词,用下划线分隔单词 | CONSTANT, MY_CONSTANT, MY_LONG_CONSTANT |
Module | 使用简短的小写单词,用下划线分隔单词 | module.py, my_module.py |
Package | 使用简短的小写单词,不要用下划线分隔单词 | package, mypackage |
2.如何选择名字
在编写代码时对命名选择需要进行足够的思考,在Python中为对象命名的最佳方法是使用描述性的名称。
在命名变量时,可能会选择简单的、单个字母的小写名称。比如这篇文章开头的引例,要将一个人的姓名存储为字符串,并且想要使用字符串切片来以不同的方式格式化姓名吗,写成如下形式是不是更舒服?
>>> name = 'Cai Xukun'
>>> first_name, last_name = name.split()
>>> print(last_name, first_name, sep=', ')
同样地,为了偷懒,你可能在选择名称时使用缩写。如下示例中,定义了一个名为db()的函数,它接受一个参数x并将其乘2倍,乍一看,这似乎是一个明智的选择,db()是double的缩写,但在一段时间后再回到这段代码,可能已经忘记了这个函数实现什么,并为偷懒付出相应代价:
def db(x):
return x * 2
以下写法则要清晰得多:
def multiply_by_two(x):
return x * 2
相同的原则也适用于Python中所有其他数据类型和对象,始终尽量使用最简洁且具有描述性的名称总不会出错。
三、代码排版布局
垂直空白,即空行,对于提升代码的可读性起着关键作用。密集堆叠的代码可能令人感到压抑,不易理解,同样地,代码中过多的空行则会让其看起来过于稀疏,带来不必要的滚动。
将顶层函数和类用两个空行隔开。顶层函数和类通常相对独立,承担不同的功能。因此,为其周围添加适量的垂直空间是合理的,这有助于清晰地标示它们的独立性:
class MyFirstClass:
pass
class MySecondClass:
pass
def top_level_function():
return None
用一个空行分隔类内方法定义:
class MyClass:
def first_method(self):
return None
def second_method(self):
return None
在函数内部使用空行以展示清晰的步骤。有时,一个复杂的函数在return之前需要完成多个步骤。为了帮助读者理解函数内部的逻辑,每个步骤之间留出一个空行会很有帮助。
在下面的示例中,有一个计算列表方差的函数。这是一个两步问题,通过在它们之间留出空行来表示每个步骤。在return之前也有一个空行,有助于清楚地看到返回了什么内容:
def calculate_variance(number_list):
sum_list = 0
for number in number_list:
sum_list = sum_list + number
mean = sum_list / len(number_list)
sum_squares = 0
for number in number_list:
sum_squares = sum_squares + number**2
mean_squares = sum_squares / len(number_list)
return mean_squares - mean**2
1.最大行长度和换行
PEP 8建议将行限制在79个字符以内,但很多时候将语句限制在79个字符或更少并不总是可能的。PEP 8概述了语句跨越多行的方法。
如果代码包含在括号、方括号或花括号内,Python会假定它是行的延续:
def function(arg_one, arg_two,
arg_three, arg_four):
return arg_one
还可以使用反斜杠来换行:
from mypkg import example1, \
example2, example3
如果需要在二元操作符(如+和)周围进行换行,应该在操作符之前进行*。这个规则源自数学,数学家们一致认为,在二元操作符之前换行可以提高可读性,可以立即看到正在相加或相减的变量,因为操作符紧邻正在操作的变量:
total = (first_variable
+ second_variable
- third_variable)
现在,让我们看一个在二元操作符之后换行的示例:
total = (first_variable +
second_variable -
third_variable)
在这里,很难看出正在相加的变量和正在相减的变量。
在二元操作符之前换行会产生更可读的代码,因此PEP 8鼓励这样做。
2.缩进
缩进在Python中非常重要。在Python中,代码行的缩进级别决定了语句如何分组在一起。
考虑以下示例:
x = 3
if x > 5:
print('x is larger than 5')
缩进的打印语句告诉Python只有在if语句返回True时才执行它。相同的缩进规则适用于在调用函数时告诉Python要执行哪些代码,或者哪些代码属于给定的类。
PEP 8规定的关键缩进规则如下:
- 使用4个连续的空格来表示缩进
- 优先选择空格而不是制表符
3.制表符 vs. 空格
如上所述,在缩进代码时应该使用空格而不是制表符。当按下Tab键时,可以调整文本编辑器的设置,将制表符字符输出为4个空格。
Python 3不允许混合使用制表符和空格。如果正在使用Python 3,则会抛出这些错误:
$ python3 code.py
File "code.py", line 3
print(i, j)
^
TabError: inconsistent use of tabs and spaces in indentation
可以使用制表符或空格来指示缩进的Python代码。但是,如果使用的是Python 3,必须在选择上保持一致,否则,代码将无法运行。
4.换行后的缩进
当使用行延续将行保持在79个字符以下时,使用缩进来提高可读性非常有用。帮助区分两行代码和跨越两行的单行代码。可以使用两种缩进样式,第一种是将缩进块与起始分隔符对齐:
def function(arg_one, arg_two,
arg_three, arg_four):
return arg_one
有时,只需要4个空格与起始分隔符对齐。这通常发生在跨多行的if语句中,因为if、空格和起始括号共计4个字符。在这种情况下,很难确定if语句内部的嵌套代码块从哪里开始:
x = 5
if (x > 3 and
x < 10):
print(x)
在这种情况下,PEP 8提供了两种改进可读性的替代方法:
- 在最终条件之后添加注释。由于大多数编辑器中的语法高亮,这将把条件与嵌套代码分开
x = 5
if (x > 3 and
x < 10):
# Both conditions satisfied
print(x)
- 在行延续上添加额外的缩进
x = 5
if (x > 3 and
x < 10):
print(x)
换行后的另一种缩进样式是悬挂缩进,悬挂缩进即段落或语句中除了第一行外的每一行都缩进。可以使用悬挂缩进来在视觉上表示代码行的延续:
var = function(
arg_one, arg_two,
arg_three, arg_four)
当使用悬挂缩进时,第一行不得有任何参数。
使用悬挂缩进时,添加额外的缩进以区分连续的行与函数内部的代码。如以下示例很难阅读,因为函数内部代码与连续的行处于相同的缩进级别:
def function(
arg_one, arg_two,
arg_three, arg_four):
return arg_one
相反,最好在行延续上使用双重缩进。这有助于区分函数参数和函数体,提高可读性:
def function(
arg_one, arg_two,
arg_three, arg_four):
return arg_one
5.右括号怎么处理
行延续允许在括号、方括号或大括号内换行。但很容易忽略闭合括号的位置,将它放在合适的地方很重要。PEP 8提供了两个选项来确定隐式行延续中闭合括号的位置。
将闭合括号与前一行的第一个非空白字符对齐:
list_of_numbers = [
1, 2, 3,
4, 5, 6,
7, 8, 9
]
将闭合括号与开始构造的行的第一个字符对齐:
list_of_numbers = [
1, 2, 3,
4, 5, 6,
7, 8, 9
]
可以自由选择使用哪个选项,但请保持一致。
四、注释
使用注释来记录代码的编写以便自己和任何合作者都能理解。在添加注释到代码时,请记住以下要点:
- 将注释和文档字符串的行长度限制在72个字符以内
- 使用完整的句子,以大写字母开头。
- 确保在更改代码时更新注释
1.块注释
块注释非常有用,帮助他人理解给定代码块的目的和功能,PEP 8为编写块注释提供以下规则:
- 将块注释的缩进与它们描述的代码保持一致
- 每行以#开头,后跟一个空格
- 使用只包含一个#的行来分隔段落
以下是解释for循环功能的块注释示例。为保持79字符行限制,句子被换行:
for i in range(0, 10):
# Loop over i ten times and print out the value of i, followed by a
# new line character
print(i, '\n')
有时,如果代码技术含量高,那么在块注释中使用多个段落是必要的:
def quadratic(a, b, c, x):
# Calculate the solution to a quadratic equation using the quadratic
# formula.
#
# There are always two solutions to a quadratic equation, x_1 and x_2.
x_1 = (- b+(b**2-4*a*c)**(1/2)) / (2*a)
x_2 = (- b-(b**2-4*a*c)**(1/2)) / (2*a)
return x_1, x_2
如果不确定哪种注释类型适合,通常可以选择使用块注释。
2.行内注释
行内注释用于解释代码片段中的单个语句。以下是PEP 8关于行内注释的建议:
- 适度使用行内注释
- 将行内注释写在与其引用的语句同一行上
- 将行内注释与语句之间用两个或更多空格分隔开
- 与块注释一样,以#和一个空格开头
- 不要用它们来解释显而易见的事情
以下是行内注释的示例:
x = 5 # This is an inline comment
有时,行内注释是必要的,但可以使用更好的命名约定来替代:
x = 'John Smith' # Student Name
在这个示例中,行内注释确实提供了额外的信息。但是,将“x”作为人名的变量名是很呆的做法,如果更改变量名称,就不需要行内注释:
student_name = 'John Smith'
最后,诸如以下的行内注释是不好的习惯(脱裤子放P),因为陈述了显而易见的事实并且会使代码混乱:
empty_list = [] # Initialize empty list
x = 5
x = x * 5 # Multiply x by 5
3.文档字符串
文档字符串,docstrings,是出现在任何函数、类、方法或模块的第一行的双引号(“”")或单引号(‘’')括起来的字符串。用于解释和记录特定的代码块。PEP 257有专门阐述docstrings,docstrings最重要规则如下:
- 在docstrings两侧使用三个双引号,如 “”“这是一个docstring”“”
- 为所有公共模块、函数、类和方法编写docstrings
- 将终止多行docstring的"""单独放在一行上
def quadratic(a, b, c, x):
"""Solve quadratic equation via the quadratic formula.
A quadratic equation has the following form:
ax**2 + bx + c = 0
There always two solutions to a quadratic equation: x_1 & x_2.
"""
x_1 = (- b+(b**2-4*a*c)**(1/2)) / (2*a)
x_2 = (- b-(b**2-4*a*c)**(1/2)) / (2*a)
return x_1, x_2
- 对于单行docstrings,请将"""保持在同一行上
def quadratic(a, b, c, x):
"""Use the quadratic formula"""
x_1 = (- b+(b**2-4*a*c)**(1/2)) / (2*a)
x_2 = (- b-(b**2-4*a*c)**(1/2)) / (2*a)
return x_1, x_2
五、表达式中的空格
在表达式和语句中适当使用空格可以非常有助于阅读。如果没有足够的空格,代码可能会难以阅读,因为它们都挤在一起。如果空格过多,则在语句中可能很难在视觉上组合相关术语。
1.二元操作符周围的空格
在以下二元操作符的两侧都加上单个空格:
- 赋值操作符(=,+=,-=等)
- 比较(==,!=,>,<,>=,<=)和(is,is not,in,not in)
- 布尔运算(and,not,or)
Tip:当使用 = 为函数参数分配默认值时,不要用空格如:def function(default_parameter=5):
当语句中有多个操作符时,在每个操作符前后都添加单个空格可能会显得混乱。相反,最好只在具有最低优先级的操作符周围添加空格,特别是在进行数学操作时。以下是几个示例:
# Recommended
y = x**2 + 5
z = (x+y) * (x-y)
# Not Recommended
y = x ** 2 + 5
z = (x + y) * (x - y)
还可以将此应用于具有多个条件的if语句:
# Not recommended
if x > 5 and x % 2 == 0:
print('x is larger than 5 and divisible by 2!')
在上面的示例中,and操作符具有最低优先级。因此,以下方式可能更清晰地表示:
# Recommended
if x>5 and x%2==0:
print('x is larger than 5 and divisible by 2!')
可以自由选择哪种更清晰,但请注意,操作符两侧必须使用相同数量的空格。
在切片中,冒号充当二元操作符。因此,适用于前一节中概述的规则,两侧应具有相同数量的空格:
list[3:4]
# Treat the colon as the operator with lowest priority
list[x+1 : x+2]
# In an extended slice, both colons must be
# surrounded by the same amount of whitespace
list[3:4:5]
list[x+1 : x+2 : x+3]
# The space is omitted if a slice parameter is omitted
list[x+1 : x+2 :]
2.何时避免添加空格
在某些情况下,添加空格可能会使代码更难阅读。PEP 8明确提供了一些不适合使用空格的示例。
最容易出Bug的是在行末,即尾随空格。因为它是不可见的,可能会产生难以追踪的错误,以下概述了一些应避免添加空格的情况:
- 紧跟在括号、方括号或花括号内:
# Recommended
my_list = [1, 2, 3]
# Not recommended
my_list = [ 1, 2, 3, ]
- 在逗号、分号或冒号之前:
# Recommended
print(x, y)
# Not recommended
print(x , y)
- 在函数参数列表左括号之前:
def double(x):
return x * 2
# Recommended
double(3)
# Not recommended
double (3)
- 在索引或切片的左括号之前:
# Recommended
list[3]
# Not recommended
list [3]
- 在尾随逗号和闭合括号之间:
# Recommended
tuple = (1,)
# Not recommended
tuple = (1, )
- 用于对齐赋值操作符:
# Recommended
var1 = 5
var2 = 6
some_long_var = 7
# Not recommended
var1 = 5
var2 = 6
some_long_var = 7
六、编程建议
1.不要使用等价运算符将布尔值与True|False进行比较
# Not recommended
my_bool = 6 > 5
if my_bool == True:
return '6 is bigger than 5'
在这里使用等价运算符(==)是不必要的,bool只能取True或False的值,以下写法已足够,PEP 8鼓励使用它:
# Recommended
if my_bool:
return '6 is bigger than 5'
如果要检查列表是否为空,首先会想要检查列表的长度,如果列表为空,它的长度为0,在if语句中使用时等效于False:
# Not recommended
my_list = []
if not len(my_list):
print('List is empty!')
然而,在Python中,任何空列表、字符串或元组都是False。因此,可以找到一个更简单的替代方案:
# Recommended
my_list = []
if not my_list:
print('List is empty!')
虽然这两个示例都会输出"List is empty!",PEP 8鼓励使用第二个方式。
2.在if语句中,使用"is not"而不是"not … is"
# Recommended
if x is not None:
return 'x exists!'
不要写成以下形式:
# Not recommended
if not x is None:
return 'x exists!'
在检查字符串是否以特定词开头或结尾时,使用.startswith()和.endswith()而不是切片:
# Not recommended
if word[:3] == 'cat':
print('The word starts with "cat"')
使用.startswith():
# Recommended
if word.startswith('cat'):
print('The word starts with "cat"')
同样的原则也适用于检查后缀:
# Recommended
if file_name.endswith('jpg'):
print('The file is a JPEG')
以上就是本期的全部内容,如果想了解更多关于PEP 8的细节可以访问:https://pep8.org/。