变量(variable)是用来从内存找到某个东西的标记
#去掉s两边的空格,再处理
value = process(s.strip())
s = " hello World "
value1 = len(s)
value2 = len(s.strip())
print(value1)
print(value2)
#用户输入可能会有空格,使用strip()去掉空格
username = extract_username(input_string.strip())
user_input = input("What's your name ? ").strip()
print(input("What's your name ? "))
print(user_input)
1.1 基础知识
1.1.1 变量常见用法
>>
>>> author = 'Maxwell'
>>> print('Hello, {}!'.format(author))
Hello, Maxwell!
>>>
在一行语句里同时操作多个变量,比如调换两个变量所指向的值
>>>
>>> author,reader = 'Maxwell','Ray'
>>> author,reader = reader,author
>>> author
'Ray'
>>>
01.变量解包
变量解包(unpacking)是Python里的一种特殊赋值操作,允许我们把一个可迭代对象(比如列表)的所有成员,一次性赋值给多个变量:
# 注意: 左侧变量的个数必须和待展开的列表长度相等,否则会报错。
>>>
>>> usernames = ['Maxwell', 'Ray']
>>> author, reader = usernames
>>> author
'Maxwell'
>>>
假如在赋值语句左侧添加小括号(...),甚至可以一次展开多层嵌套数据:
>>>
>>> attrs = [1, ['maxwell', 100]]
>>> user_id, (username, score) = attrs
>>> user_id
1
>>> username
'maxwell'
>>>
Python还支持更灵活的动态解包语法。只要用星号表达式(*variables)作为变量名,它便会贪婪[插图]地捕获多个值对象,并将捕获到的内容作为列表赋值给variables。
>>>
>>> data = ['Maxwell', 'apple','orange','banana', 100]
>>> username, *fruits, score = data
>>> username
'Maxwell'
>>> fruits
['apple', 'orange', 'banana']
>>> score
100
>>>
和常规的切片赋值语句比起来,动态解包语法要直观许多:
#1. 动态解包
>>> username, *fruits, score = data
# 2. 切片赋值
>>> username, fruits, score = data[0], data[1:-1], data[-1]
# 两种变量赋值方式完全等价
>>>
>>>
>>> for username, score in [('Maxwell',100), ('Ray', 60)]:
... print(username)
...
Maxwell
Ray
>>>
02.单下划线变量名_
在常用的诸多变量名中,单下划线_是比较特殊的一个。它常作为一个无意义的占位符出现在赋值语句中。_这个名字本身没什么特别之处,这算是大家约定俗成的一种用法。
举个例子,假如你想在解包赋值时忽略某些变量,就可以使用_作为变量名
#忽略展开时的第二个变量
>>> author, _ = usernames
# 忽略第一个和最后一个变量之间的所有变量
>>> username, *_, score = data
而在Python交互式命令行(直接执行python命令进入的交互环境)里,_变量还有一层特殊含义——默认保存我们输入的上个表达式的返回值:
>>>
>>> 'foo'.upper()
'FOO'
>>> print(_)
FOO
>>>
1.1.2 给变量注明类型
为了解决动态类型带来的可读性问题,最常见的办法就是在函数文档(docstring)里做文章。我们可以把每个函数参数的类型与说明全都写在函数文档里。
def remove_invalid(items):
"""剔除 items 里面无效的元素
:param items: 待剔除对象
:type items: 包含整数的列表,[int, ...]
"""
下面是给remove_invalid()函数添加类型注解后的样子:
from typing import List
def remove_invalid(items: List[int]): ➊
"""剔除 items 里面无效的元素"""
... ...
❶List表示参数为列表类型,[int]表示里面的成员是整型
强烈建议在多人参与的中大型Python项目里,至少使用一种类型注解方案——Sphinx格式文档或官方类型注解都行。能直接看到变量类型的代码,总是会让人更安心。
1.1.3 变量命名原则
计算机科学领域只有两件难事:缓存失效和命名。——Phil Karlton
01.遵循PEP 8原则
给变量起名主要有两种流派:一是通过大小写界定单词的驼峰命名派CamelCase,二是通过下划线连接的蛇形命名派snake_case。这两种流派没有明显的优劣之分,似乎与个人喜好有关
ython制定了官方的编码风格指南:PEP 8。这份风格指南里有许多详细的风格建议,比如应该用4个空格缩进,每行不超过79个字符,等等。其中,当然也包含变量的命名规范:
· 对于普通变量,使用蛇形命名法,比如max_value;
· 对于常量,采用全大写字母,使用下划线连接,比如MAX_VALUE;
· 如果变量标记为“仅内部使用”,为其增加下划线前缀,比如_local_var;
· 当名字与Python关键字冲突时,在变量末尾追加下划线,比如class_。
除变量名以外,PEP 8中还有许多其他命名规范,比如类名应该使用驼峰风格(FooClass)、函数应该使用蛇形风格(bar_function),等等。给变量起名的第一条原则,就是一定要在格式上遵循以上规范。
PEP 8是Python编码风格的事实标准。“代码符合PEP 8规范”应该作为对Python程序员的基本要求之一。
02.描述性要强
#描述性弱的名字:看不懂在做什么
value = process(s.strip())
# 描述性强的名字:尝试从用户输入里解析出一个用户名
username = extract_username(input_string.strip())
表1-1 描述性弱和描述性强的变量名示例
03.要尽量短
中诀窍在于:为变量命名要结合代码情境和上下文。比如在上面的代码里,upgrade_to_level3(user)函数已经通过自己的名称、文档表明了其目的,那在函数内部,我们完全可以把how_many_points_needed_for_user_level3直接删减成level3_points。
04.要匹配类型
匹配布尔值类型的变量名
布尔值(bool)是一种很简单的类型,它只有两个可能的值:“是”(True)或“不是”(False)。
表1-2 布尔值变量名示例
匹配int/float类型的变量名
自然就会认定它们是int或float类型。这些名字可简单分为以下几种常见类型:
- 释义为数字的所有单词,比如port(端口号)、age(年龄)、radius(半径)等;
- 使用以_id结尾的单词,比如user_id、host_id;
- 使用以length/count开头或者结尾的单词,比如length_of_username、max_length、users_count。
匹配其他类型的变量名
字符串(str)、列表(list)、字典(dict)
05.超短命名
在众多变量名里,有一类非常特别,那就是只有一两个字母的短名字。这些短名字一般可分为两类,一类是那些大家约定俗成的短名字,比如:
· 数组索引三剑客i、j、k
· 某个整数n
· 某个字符串s
· 某个异常e
· 文件对象fp
其他技巧
除了上面这些规则外,下面再分享几个给变量命名的小技巧:
· 在同一段代码内,不要出现多个相似的变量名,比如同时使用users、users1、users3这种序列;
· 可以尝试换词来简化复合变量名,比如用is_special来代替is_not_normal;
· 如果你苦思冥想都想不出一个合适的名字,请打开GitHub[插图],到其他人的开源项目里找找灵感吧!
1.1.4 注释基础知识
注释(comment)是代码非常重要的组成部分。通常来说,注释泛指那些不影响代码实际行为的文字,它们主要起额外说明作用。
Python里的注释主要分为两种,一种是最常见的代码内注释,通过在行首输入#号来表示:
#用户输入可能会有空格,使用strip去掉空格
username = extract_username(input_string.strip())
另一种注释则是我们前面看到过的函数(类)文档(docstring),这些文档也称接口注释(interface comment)。
class Person:
"""人
:param name: 姓名
:param age: 年龄
:param favorite_color: 最喜欢的颜色
"""
def __init__(self, name, age, favorite_color):
self.name = name
self.age = age
self.favorite_color = favorite_color
接口注释有好几种流行的风格,比如Sphinx文档风格、Google风格等,其中Sphinx文档风格目前应用得最为广泛。上面的Person类的接口注释就属于Sphinx文档风格。
编程新手们常常会犯同类型的错误,以下是我整理的最常见的3种。
01.用注释屏蔽代码
#源码里有大段大段暂时不需要执行的代码
# trip = get_trip(request)
# trip.refresh()
# ... ...
对于不再需要的代码,我们应该直接把它们删掉,而不是注释掉。
02.用注释复述代码
在编写注释时,新手常犯的另一类错误是用注释复述代码。
#调用strip()去掉空格
input_string = input_string.strip()
指引性注释。这种注释并不直接复述代码,而是简明扼要地概括代码功能,起到“代码导读”的作用。
以下代码里的注释就属于指引性注释:
#初始化访问服务的client对象
token = token_service.get_token()
service_client = ServiceClient(token=token)
service_client.ready()
# 调用服务获取数据,然后进行过滤
data = service_client.fetch_full_data()
for item in data:
if item.value > SOME_VALUE:
...
指引性注释并不提供代码里读不到的东西——假如没有注释,耐心读完所有代码,你也能知道代码做了什么事儿。指引性注释的主要作用是降低代码的认知成本,让我们能更容易理解代码的意图。
03.弄错接口注释的受众
接口文档主要是给函数(或类)的使用者看的,它最主要的存在价值,是让人们不用逐行阅读函数代码,也能很快通过文档知道该如何使用这个函数,以及在使用时有什么注意事项。
对于上面的resize_image()函数来说,文档里提供以下内容就足够了:
def resize_image(image, size):
"""将图片缩放到指定尺寸,并返回新的图片。
注意:当文件超过 5MB 时,请使用resize_big_image()
:param image: 图片文件对象
:param size: 包含宽高的元组:(width, height)
:return: 新图片对象
"""
1.3 编程建议
1.3.1 保持变量一致性
在foo()函数的作用域内,users变量被使用了两次:第一次指向字典,第二次则变成了列表。虽然Python的类型系统允许我们这么做,但这样做其实有很多坏处,比如变量的辨识度会因此降低,还很容易引入bug。
建议在这种情况下启用一个新变量:
def foo():
users = {'data': ['piglei', 'raymond']}
...
# 使用一个新名字
user_list = []
...
1.3.2 变量定义尽量靠近使用
def generate_trip_png(trip):
"""
根据旅途数据生成 PNG 图片
"""
# 预先定义好所有的局部变量
waypoints = []
photo_markers, text_markers = [], []
marker_count = 0
# 开始初始化 waypoints 数据
waypoints.append(...)
...
# 经过几行代码后,开始处理 photo_markers、text_markers
photo_markers.append(...)
...
# 经过更多代码后,开始计算 marker_count
marker_count += ...
# 拼接图片:已省略……
1.3.3 定义临时变量提升可读性
#为所有性别为女或者级别大于3的活跃用户发放10000个金币
user_is_eligible = user.is_active and (user.sex == 'female' or user.level > 3)
if user_is_eligible:
user.add_coins(10000)
return
1.3.4 同一作用域内不要有太多变量
代码清单1-3 局部变量过多的函数
def import_users_from_file(fp):
"""尝试从文件对象读取用户,然后导入数据库
:param fp: 可读文件对象
:return: 成功与失败的数量
"""
# 初始化变量:重复用户、黑名单用户、正常用户
duplicated_users, banned_users, normal_users = [], [], []
for line in fp:
parsed_user = parse_user(line)
# …… 进行判断处理,修改前面定义的{X}_users 变量
succeeded_count, failed_count = 0, 0
# …… 读取 {X}_users 变量,写入数据库并修改成功与失败的数量
return succeeded_count, failed_count
代码清单1-4 对局部变量分组并建模
class ImportedSummary:
"""保存导入结果摘要的数据类"""
def __init__(self):
self.succeeded_count = 0
self.failed_count = 0
class ImportingUserGroup:
"""用于暂存用户导入处理的数据类"""
def __init__(self):
self.duplicated = []
self.banned = []
self.normal = []
def import_users_from_file(fp):
"""尝试从文件对象读取用户,然后导入数据库
:param fp: 可读文件对象
:return: 成功与失败的数量
"""
importing_user_group = ImportingUserGroup()
for line in fp:
parsed_user = parse_user(line)
# …… 进行判断处理,修改上面定义的importing_user_group 变量
summary = ImportedSummary()
# …… 读取 importing_user_group,写入数据库并修改成功与失败的数量
return summary.succeeded_count, summary.failed_count
1.3.5 能不定义变量就别定义
定义临时变量可以提高代码的可读性。但有时,把不必要的东西赋值为临时变量,反而会让代码显得啰唆:
def get_best_trip_by_user_id(user_id):
# 心理活动:嗯,这个值未来说不定会修改/二次使用,我们先把它定义成变量吧!
user = get_user(user_id)
trip = get_best_trip(user_id)
result = {
'user': user,
'trip': trip
}
return result
上面这段代码里的三个临时变量完全可以去掉,变成下面这样:
def get_best_trip_by_user_id(user_id):
return {
'user': get_user(user_id),
'trip': get_best_trip(user_id)
}
1.3.6 不要使用locals()
locals()是Python的一个内置函数,调用它会返回当前作用域中的所有局部变量:
def foo():
name = 'piglei'
bar = 1
print(locals())
# 调用foo() 将输出:
{'name': 'piglei', 'bar': 1}
Python之禅:显式优于隐式
"Python之禅"中有一句“Explicit is better than implicit”(显式优于隐式)
1.3.7 空行也是一种“注释”
代码里的注释不只是那些常规的描述性语句,有时候,没有一个字符的空行,也算得上一种特殊的“注释”。
1.3.8 先写注释,后写代码
每个函数的名称与接口注释(也就是docstring),其实是一种比函数内部代码更为抽象的东西。你需要在函数名和短短几行注释里,把函数内代码所做的事情,高度浓缩地表达清楚。
在写出一句有说服力的接口注释前,别写任何函数代码。
1.4 总结
以下是本章要点知识总结。
(1)变量和注释决定“第一印象”
· 变量和注释是代码里最接近自然语言的东西,它们的可读性非常重要
· 即使是实现同一个算法,变量和注释不一样,给人的感觉也会截然不同(2)基础知识·
Python的变量赋值语法非常灵活,可以使用*variables星号表达式灵活赋值
· 编写注释的两个要点:不要用来屏蔽代码,而是用来解释“为什么”
· 接口注释是为使用者而写,因此应该简明扼要地描述函数职责,而不必包含太多内部细节· 可以用Sphinx格式文档或类型注解给变量标明类型
(3)变量名字很重要· 给变量起名要遵循PEP 8原则,代码的其他部分也同样如此
· 尽量给变量起描述性强的名字,但评价描述性也需要结合场景
· 在保证描述性的前提下,变量名要尽量短
· 变量名要匹配它所表达的类型
· 可以使用一两个字母的超短名字,但注意不要过度使用
(4)代码组织技巧
· 按照代码的职责来组织代码:让变量定义靠近使用
· 适当定义临时变量可以提升代码的可读性
· 不必要的变量会让代码显得冗长、啰唆
· 同一个作用域内不要有太多变量,解决办法:提炼数据类、拆分函数
· 空行也是一种特殊的“注释”,适当的空行可以让代码更易读
(5)代码可维护性技巧
· 保持变量在两个方面的一致性:名字一致性与类型一致性
· 显式优于隐式:不要使用locals()批量获取变量
· 把接口注释当成一种函数设计工具:先写注释,后写代码