1.布尔值
- Python2中没有布尔值,直接用数字0表示Flase,用数字1表示True。
- Python3中,把True和False定义成了关键字,但他们的本质还是1和0,甚至可以和数字相加。
>>> a = True
>>> b = 3
>>> a+b
4
2.比较运算符
所有比较运算符返回1表示真,返回0表示假。这分别与特殊的变量True和Flase等价,以下假设变量a为15,变量b为30;
运算符 | 描述 | 实例 |
---|---|---|
== | 等于 - 比较对象的值是否相等 | (a == b)返回False |
!= | 不等于 | 不等于 - 比较两个对象的值是否不相等 |
> | 大于 - 返回x是否大于y | (a>b)返回False |
< | 小于 - 返回x是否小于y | (a<b)返回true |
<= | 小于等于 - 返回x是否小于等于y | (a<=b)返回True |
逻辑运算符
运算符 | 格式 | 说明 |
---|---|---|
or 逻辑或 | x or y | x为true,则返回true x为false,则返回y |
and 逻辑与 | x and y | x为true,则返回y的值 x为false,则返回false |
not | not x | x为true,返回false x为false,返回true |
同一运算符
同一运算符用于比较两个对象的存储单元,实际比较的是对象的地址。
运算符 | 描述 |
---|---|
is | is是判断两个标识服符是不是引用同一个对象 |
is not | is not 是判断两个标识符是不是引用不同对象 |
is与 == 区别:
is用于判断两个变量引用对象是否为同一个,即比较对象的地址。
== 用于判断变量引用对象的值是否相等,默认调用对象的_eq_()方法。
- 整数缓存问题
Python仅仅对比较小的整数对象进行缓存(范围为[-5,256])缓存起来,而并非是所有整数对象。需要注意的是,这仅仅是在命令行中执行,而在Pycham或则和保存为文件执行,结果是不一样的,这是因为解释器做了一部分优化(范围是[-5,任意正整数])。
总结
- is比较两个对象的id值是否相等,是否向同一个内存地址;
- == 比较的是两个对象的内容是否相等,值是否相等;
- 小整数对象[-5,256]在全局解释器范围内被放入缓存供重复使用;
- is运算符比 == 效率高,在变量和None进行比较时,应该使用is。
【操作】用户输入年龄,判断是否为青年(小于45岁)
3.字符串基本特点
很多初学编程时,总是担心自己数学不行,潜意识里认为数学好才能学编程,实际上,大多数程序员打交道最多的是"字符串"而不是"数字"。因为,编程是用来解决现实问题的,因此逻辑思维的重要性远远超过数学能力。
字符串本质是:字符序列。Python的字符串是不可变的,我们无法对原字符串做任何修改。但,我们可以将字符串的一部分复制待新创建的字符串,达到"看起来修改"的效果。
Python不支持字符类型,单字符也是作为一个字符串使用的。
字符串的编码
Python3直接支持Unicode,可以表示世界上任何书面语言的字符,Python3的字符默认就是16位Unicode编码,ASCII码是Unicode编码的子集。
- 使用内置函数ord()可以把字符转换成对应的Unicode码;
- 使用内置函数chr()可以把十进制数字转换成对应的字符。
>>> ord('A')
65
>>> ord('高')
39640
>>> chr(66)
'B'
>>> ord('瑞')
28103
引号创建字符串
我们可以通过单引号或双引号创建字符串。例如: a= ‘abc’ ; b=“sxt”
使用两种引号的好处是可以创建本身就包含引号的字符串,而不是使用转义字符。例如:
>>> a = "I'm a teacher!"
>>> print(a)
I'm a teacher!
>>> b = 'my_name is "TOM"'
>>> print(b)
my_name is "TOM"
连续三个单引号或三个双引号,可以帮助我们创建多行字符串。例如:
>>> resume = "'name="ring"'
company="sxt" age=18
lover="Tom"
>>> print(resume)
name="ring"
company="sxt" age=18
lover="Tom"
空字符串和len()函数
Python允许字符串的存在,不包含任何字符且长度为0。例如:
>>> c="
>>> len(c)
0
len()用于计算字符串含有多少字符。例如:
>>> d='abc的朋友'
>>> len(d)
6
转义字符
我们可以使用"+特殊字符",实现某些难以用字符表示的效果。比如:换行等。常见的转义字符有这些:
转义字符 | 描述 |
---|---|
(在行尾时) | 续行符 |
|反斜杠符号 | |
’ | 单引号 |
* | 双引号 |
\b | 退格(Backspace) |
\n | 换行 |
\t | 横向制表符 |
\r | 回车 |
【操作】
测试转义字符的使用
>>> a ='I\nlove\nU'
>>> a
'I\nlove\nU'
>>> print(a)
I
love
U
>>> print('aaabb\cccddd')
aaabbccccddd
【操作】使用原始字符串输出的技巧
>>> c='c:\aa\bb.mp4'
>>> c
'c:\x07a\x08b.mp4'
>>> c
'\\c:\\aa\\bb.mp4'
>>> c=r'c:\aa\bb.mp4'
>>> c
'c:\\aa\\bb.mp4'
字符串拼接
1.可以使用+将多个字符串拼接起来。例如:‘aa’ + ‘bb’ ==> ‘aabb’。
(1)如果+两边都是字符串,则拼接。
(2)如果+两边都是数字,则加法运算。
(3)如果+两边类型不同,则抛出异常。
2.可以将多个字面字符串直接放到一起实现拼接。例如:‘aa’ ‘bb’ ==> ‘aabb’
【操作】
字符串拼接操作
>>> a = 'sxt' +'gaoqi'
>>> a
'sxtgaoqi'
>>> b = 'sxt''gaoqi'
>>> b
'sxtgaoqi'
字符串复制
使用*可以实现字符串复制。
【操作】字符串复制操作
>>> a ='Sxt'*3
>>> a
'SxtSxtSxt'
不换行打印
我们前面调用print时,会自动打印一个换行符。有时,我们不想换行,不想自动添加换行符。我们可以自己通过参数end= “任意字符串”。实现末尾添加任何内容:
建立源文件mypy_06.py:
print("sxt",end=' ')
print("sxt",end='###')
print("sxt")
运行结果:
sxt sxt##sxt
##从控制台读取字符串
我们可以使用input()从控制台读取键盘输入的内容:
>>> myname = input("请输入名字")
请输入名字:ring
>>> nyname
'ring'
str()实现数字转型字符串
str()可以帮助我们将其数据类型转换为字符串。例如:
str(5.20) ==> '5.20'
str(3.14e2) ==>'314.0'
str(True) ==>'True'
当我们调用print()函数时,解释器自动调用str()将非字符串的对象转成了字符串。我们在面向对象章节中详细讲解这部分。
使用[]提取字符
字符串的本质就是字符序列,我们可以在字符串后面添加[],在[]里面指定偏移量,可以提取该位置的单个字符。
正向搜索:
最左侧第一个字符,偏移量是0,第二个偏移量是1,以此类推。直到len(str)-1为止。
反向搜索:
最右侧第一个字符,偏移量是-1,倒数第二个偏移量-2,以此类推,直到-len(str)为止。
【操作】使用[]提取字符串中的字符
>>> a ='qwertyuiop'
>>> a
'qwertyuiop'
>>> a[0]
'q'
>>> a[3]
'r'
>>> a[10-1]
'p'
>>> a[-1]
'z'
>>>a[-10]
'q'
>>> a[-20]
Traceback(most recent call last):
File"<pyshell#91>",line1,in <module>
a[-20]
IndexError:string.index out of range
replace()实现字符替换
字符串是"不可改变"的,我们通过[]可以获取字符串指定位置的字符,但是我们不能改变字符串。我们尝试改变字符串中的某个字符,发现报错了:
>>> a ='qwertyuiop'
>>> a
'qwertyuiop'
>>> a[3] = '高'
Traceback (most recent call last):
File "<pyshell#94>",line1,in<module>
a[3] = '高'
TypeError:'str' object does not support item assignment
字符串不可改变,但是我们确实有时候需要替换某些字符。这时,只能通过创建的字符串来实现。
>>> a = 'qwertyuiop'
>>> a
'qwertyuiop'
>>> a.replace('e','高')
'qw高rtyuiop'
整个过程中,实际我们是创建了新的字符串对象,并指向了变量a,而不是修改来以前的字符串。内存图如下:
字符串切片slice操作
切片silce操作可以让我们快速的提取字符串,标准格式为:
[起始偏移量start:终止偏移量 end:步长step]
典型操作(三个量为正数的情况)如下:
操作和说明 | 示例 | 结果 |
---|---|---|
[:] 提取整个字符串 | “abcdef” [:] | “abcdef” |
[start]从start索引开始到结尾 | “abcdef” [2:] | “cdef” |
[:end]从头开始知道end -1 | “abcdef” [:2] | “ab” |
[start:end]从start到end-1 | “abcdef” [2:4] | “cd” |
[start🔚step]从start提取到end-1,步长是step | “abcdef” [1:5:2] | “bd” |
其他操作(三个量为负数)的情况:
示例 | 说明 | 结果 |
---|---|---|
“asdfghjkl” [-3:] | 倒数三个 | “jkl” |
“asdfghjkl”[-8:-3] | 倒数第八个到倒数第三个(包头不包尾) | “sdfgh” |
“asdfghjkl”[::-1] | 步长为负,从右到左反向提取 | “lkjhgfdsa” |
切片操作时,起始偏移量和终止偏移量不在[0,字符串长度-1]这个范围,也不会报错。起始偏移量小于0则会当做0,终止偏移量大于"长度-1"会被当成-1,例如:
>>> "abcdefg"[3:50]
'defg'
我们发现正常输出了结果,没有报错。
【操作】
- 将"to be or not to be"字符串倒序输出
- 将"sxtsxtsxtsxtsxt"字符串中所有的s输出
split()分割和join()合并
split()可以基于指定分隔符将字符串分割成多个子字符串(存储到列表中)。如果不指定分隔符,则默认使用空白字符(换行符/空格/制表符)。示例代码如下:
>>> a = "to be not to be"
>>> a.split()
['to','be','or','not','to','be']
>>> a.split('be')
['to','or not to','']
join()的作用和split()作用刚好相反,用于将一系列子字符串连接起来。示例代码如下:
>>> a =['sxt,sxt100','sxt200']
>>> '*'.join(a)
'sxt*sxt100*sxt200'
拼接字符串要点:
使用字符串拼接符+,会生成新的字符对象,因此不推荐使用+来拼接字符串。推荐使用join函数,因为join函数在拼接字符串之前计算所有字符串的长度,然后逐一拷贝,仅新建一次对象。
【操作】测试+拼接符和join(),不同的效率
import time
time01 = time.time() #起始时刻
a = " "
for i in range(10000000):
a += "sxt"
time02 = time.time() #终止时刻
print("运算时间:"+str(time02-time01))
time03 = time.time() #起始时刻
li = []
for i in range(10000000):
li = []
for i in range(10000000) :
LI.append("sxt")
a = " ".join(li)
time04 = time.time() #终止时刻
print("运算时间:"+str(time04-time03))
字符串驻留机制和字符串比较
**字符串驻留:**仅保存一份相同切不可变字符串的方法,不同的值被存放在字符串驻留池中。
Python支持字符串驻留机制,对于符合标识符规则的字符串(仅包含下划线(_)、字母和数字)会启用字符串驻留机制。
>>> a = "abd_33"
>>> b = "abd_33"
>>> a is b
>True
>>> c = "dd#"
>>> d = "dd#"
>>> c is d
Flase
>>> str1 = "aa"
>>> str2 = "bb"
>>> str1 +str2 is "aabb"
True
字符串比较和同一性
我们可以直接使用++,!=对字符进行比较,是否含有相同的字符。
我们使用is /not is,判断两个对象是否同一个对象。比较的是对象的地址,即id(obj1)是否和id(obj2)相等。
成员操作符
in/not in 关键字,判断某个字符(子字符串)是否存在于字符串中。
字符串常用方法汇总:
常用查找方法:
我们以一段文本作为测试:
a = “我是tom,今年20岁,我在西安上班。我的朋友是LiMing,他22岁了,我是一个编程教育普及者,希望影响6000万学习编程的中国人。我的朋友现在也开始学习编程,希望他以后能够超越我”
方法和使用示例 | 说明 | 结果 |
---|---|---|
len(a) | 字符串长度 | 96 |
a.startswith(‘我是Tom’) | 以指定字符串开头 | True |
a.endswith(‘过我’) | 以指定字符串结尾 | True |
a.find(‘高’) | 第一次出现指定字符串的位置 | 2 |
a.rifind(‘高’) | 最后一次出现指定字符串的位置 | 29 |
a.count(“编程”) | 指定字符串出现了几次 | 3 |
a.isalnum() | 所有字符全是字母或数字 | False |
去除首尾信息
我们可以通过strip()去除字符串首尾指定信息。通过lstrip()去除字符串左边指定信息,rstrip()去除字符串右边指定信息。
【操作】去除字符串首尾信息
>>> "*s*x*t*" .strip("*")
's*x*t*'
>>> "*s*x*t*" .rstrip("*")
'*s*x*t'
>>> "sxt" .strip()
'sxt'
大小写转换
编程中关于字符串大小写转换的情况,经常遇到。我们将相关方法汇总到这里。为了方便学习,先设定一个测试变量:
a = “gaoqi love programming, love SXT”
示例 | 说明 | 结果 |
---|---|---|
a.capitalize() | 产生新的字符串,首字母大写 | ‘Gao love prrogramming, love SXT’ |
a.title() | 产生新的字符串,每个单词都首字母大写 | ‘Gaoqi Love Programming, Love SXT’ |
a.upper() | 产生新的字符串,所有字符全转成大写 | GAOQI LOVE PROGRAMMING, LOVE SXT |
a.lower() | 产生新的字符串,所有字母全转成小写 | ‘gaoqi love programming, love sxt’ |
a.swapcase() | 产生新的,所有字母大小写转换 | ‘GAOQI LOVWPROGRAMMING, LOVE sxt’ |
格式排版
center()、ljust()、rjust这三个函数用于对字符串实现排版。示例如下:
>>> a="SXT"
>>> a.center(10,"*")
'***SXT****'
>>> a.center(10)
' SXT '
>>> a.ljust(10,"*")
'SXT*******'
其他方法
1.isalnum() 是否为字母或数字
2.isalpha() 检测字符串是否只由字母组成(含汉字)。
3.isdigit() 检测字符串是否只由数字组成。
4.isspace() 检测是否为空白符。
>>> "sxt100".isalnum()
True
>>> "sxt帅哥.isalpha"
True
>>> "234.3".isdigit()
False
>>> "23423".isdigit()
True
>>> "aB".issupper()
False
>>> "A".isupper()
True
>>> "\t\n".isspace()
True