Python基础核心知识点（建议收藏再用）

一、python入门day1-day24
- day01-03 编程语言
- day04 变量
- day05 垃圾回收机制（GC机制）
  - 1 引用计数
  - 2 标记清除
  - 3 分代回收
- day05 程序交互与基本运算符
- day06 可变不可变类型
- day07 流程控制
  - 1 赋值 =
  - 2 浅拷贝 copy
  - 3 深拷贝 deepcopy
- day08-10 基本数据类型
  - 1 字符串
  - 2 列表
  - 3 元组
  - 4 字典
  - 5 集合
  - 6 基本数据类型总结
- day10 字符编码
  - 1 ascii表
  - 2 GBK（中国），Shift_JIS（日本）等等
  - 3 unicode
  - 4 utf-8
- day11-12 文件操作
  - 1 读相关操作：
  - 2 写相关操作：
  - 3 文件高级操作：
- day13-14 函数基础
- day15 名称空间和作用域
  - 1 命名关键字参数：
  - 2 名称空间的存活时间
- day16 闭包函数
- day17 装饰器
  - 修正装饰器：
- day18 迭代器+生成器
  - 1 迭代器
  - 2 生成器
- day19 生成式
  - 1 三元表达式
  - 2 生成式
    - 2.1 列表生成式
    - 2.2 字典生成式
    - 2.3 集合生成式
    - 2.4 生成器表达式
- day20 匿名函数
  - 1 lambda使用
  - 2 lambda与内置函数的应用
  - 3 map
  - 4 reduce
  - 5 filter
- day21模块（略）
- day22-24 常用模块
  - 1 time模块
  - 2 datetime模块
  - 3 random模块
  - 4 os
  - 5 sys模块
  - 6 shutil
  - 7 json&pickle
  - 8 hashlib
  - 9 logging（略）
  - 10 re（略）

一、python入门day1-day24

day01-03 编程语言

python是一种强类型的解释型语言

day04 变量

变量名不能以数字开头

小整数池的范围[-5,256]，pycharm里这个范围非常大

这是为了优化内存的合理安排

指向相同数字的变量名id相同

day05 垃圾回收机制（GC机制）

为了解决没有被引用的数据（垃圾）大量占用内存导致程序崩溃

1 引用计数

a = 10 表示10被a引用了1次，a = 20 表示a和10断开链接，a与20相连接20的引用计数为1，10的引用计数为0（垃圾）

存在的问题：循环引用

l1 = ['xxx']
l2 = ['yyy']
l1.append(l2)
l2.append(l1)
# l1与l2循环引用了
# 此时['xxx']被l1引用了1次，被['yyy']引用了一次，引用计数为2
# 此时['yyy']被l1引用了1次，被['xxx']引用了一次，引用计数为2

del l1
del l2
# 按照常规['xxx']['yyy']此时的引用计数为0要被清除，但是由于循环引用的问题，他们俩彼此互相引用导致引用计数失效

2 标记清除

标记清除是当内存即将被程序占满的时候，把程序停下来，进行标记清除

标记清除分为两步：

标记
- 遍历所有的GC Roots对象（栈区内所有的名字或者线程），将所有可以被直接或者间接访问到的堆区对象标记存活
清除
- 遍历堆区所有对象，没有被标记的就清除。

刚刚循环引用的地方，堆区的两个列表虽然互相引用，但是他们没有被栈区的任何对象直接或者间接访问，所以没有被标记，就被清除了。

3 分代回收

分代回收解决了引用计数的第二个问题，效率

工作原理：根据栈区中名字的使用频率为他们划分代，不同代的名字扫描频率不同。

day05 程序交互与基本运算符

/ 除，显示小数点

// 取整除，不显示小数点

解压赋值

num = [1,2,3,4]

# 全部解压
a,b,c,d = num
>>> a=1 b=2 c=3 d=4

# 部分解压
a,b,*_=num
>>> a=1 b=2

day06 可变不可变类型

可变类型：列表，字典（key：不可变类型，value：任意类型）

不可变类型：整形，浮点型，字符串，bool

day07 流程控制

深浅拷贝

1 赋值 =

l1 = [1,2,[3,4]]
l2 = l1
# 这时候l1 就是l2，id相同，对l1内部的可变类型不可变类型的修改都会影响l2

2 浅拷贝 copy

l1 = [1,2,[3,4]]
l2 = l1.copy()
# 把l1内部的第一层内存地址都copy给l2，l1和l2是两个id不同的列表
# 内部的可变类型其实是同一个，所以会同时修改
# 修改l1内部的不可变类型，l2不会跟着变
# 修改l1内部的可变类型，l2也会变

3 深拷贝 deepcopy

import copy 
l1 = [1,2,[3,4]]
l2 = copy.deepcopy(l1)
# 把l1内部的第一层内存地址都copy给l2，l1和l2是两个id不同的列表
# 不同的是，可变类型会在内存中复制一份，所以修改可变类型其实是不同的

这里注意的点就是可变类型的修改和不可变类型修改的区别

不可变类型直接会断开和原数据的链接，重新链接新数据

可变类型则是在原数据上进行修改

day08-10 基本数据类型

1 字符串

strip 去掉左右两边指定字符，默认空格（扩展：rsrip，lsrip）
split 从左到右以指定字符切割，默认空格，可以指定次数，默认全部（扩展rsplit，从右到左以指定字符切割）
lower 全大写，upper 全小写
srartswith 以什么为开头，endwith 以什么为结尾

','join('hz') # 分隔字符串
>>> h,z

replace 替换字符
isdigit 判断是否纯数字
find 查找是否有指定字符有则返回索引，无则返回-1
index查找是否有指定字符，有则返回索引，无则报错
count 统计赐重复出现的个数

2 列表

append 追加元素
extend 追加可迭代对象，会自动把可迭代对象循环添加，列表会循环添加key
insert 插入
del 常规删除，没有返回值
- ```
x = ['aa','bb']
del x[0]
```
pop 索引删除，不写默认删除最后一个，返回值为删除的元素
remove 指名道姓删除，返回值为None
count 统计指定元素出现次数
index 查找指定元素索引
clear 清空索引
reverse 反转列表
sort 排序

3 元组

看做是不可修改的列表

注意：元组内必须加逗号，如果一个或者没有元素的时候元组不加逗号会看成数学的括号

index 查找指定元素索引
count 统计指定元素出现次数

4 字典

get 取值，和索引取的区别是get取不到返回None，索引取不到报错
pop 删除，返回值为key
popitem 随机删除，删除的键值对以（key，value）的形式返回
update 更新，存在则修改，不存在则新增
setdefault 新增，key不存在则新增，key存在则返回原来的value值

注意：

python3.5之后的字典是有序字典，因为更新之后优化了内部字典的存值方式，把原来的二维数组分成了现在一个一维数组+一个二维数组，但是原本创建一个字典就会创建8个位置，现在是创建一个字典生成一个位置

5 集合

可以把可变类型转化成集合在转回来可以去重，但是这种去重是无序的

关系运算
- & 交集共有的
- | 合集融合去重
- — 差集某个集合单有的
- ^ 对称差集两个集合单独有的的合集
- ＞父子集判断是否包含
discard 删除，存在则删除，不存在不变化
remove 删除，存在则删除，不存在则报错
update 更新，括号内放集合，会自动与元集合取合集
pop 删除指定元素，并返回，不写删除第一个
add 添加元素，只能添加不可变类型

6 基本数据类型总结

不包含集合

按照存值个数区分
- 只能存一个值：数字，字符串
- 可以存多个值：字典，列表，元组
按访问方式区分
- 直接访问：数字
- 顺序访问/索引访问：字符串，列表，元组
- key访问：字典
可变不可变区分
- 可变：列表，字典，集合
- 不可变：数字，元组，字符串

day10 字符编码

1 ascii表

只有英文字符与数字的一一对应关系

一个英文字符对应一个字节（bytes），一个字节等于8个bit，8个bit最多包含256个数字

2 GBK（中国），Shift_JIS（日本）等等

只有对应国家的文字和英文字符与数字的一一对应关系

2字节代表一个汉字

3 unicode

此时只能转换成对应字符编码的二进制，当出现unicode的时候开始统一

所有存在的文字都有与数字的一一对应关系，而传统的GBK等字符编码也能在unicode内找到对应关系

4 utf-8

当我们出现要输入多国语言的时候，unicode就会显得很臃肿

utf-8会显得更灵活

utf-8是针对unicode的可变长度字符编码，一个英文字符占一个bytes，一个汉字占3个，生僻字占更多

day11-12 文件操作

with 上下文资源管理，会自动帮我们在次级代码结束后关闭文件

显示模式：t文本模式（默认），b二进制

操作模式：r只读（默认），w只写，a只追加，+全都能读能写

1 读相关操作：

readline 一次读一行
readlines 把文件内容按照换行符为分隔返回列表
read 读取全部内容

2 写相关操作：

write 写入全部内容
writelines 是readlines的反操作

flsh 刷新

3 文件高级操作：

f.seek(n，模式) n代表移动的字节数

0模式，参照物是文件的开头
1模式，参照物是光标当前所在位置
2模式，参照物是文件末尾，n为负数倒着移动
f.tell（）得到当前光标所在位置

day13-14 函数基础

函数的返回值如果是多个元素，会自动放在一个元组内

day15 名称空间和作用域

1 命名关键字参数：

在传参时，*后面的都是命名关键字参数

特点是必须要以关键字传参方式传

2 名称空间的存活时间

内置名称空间，解释器启动则存活，解释器关闭则销毁
全局名称空间，文件执行则存活，文件关闭则销毁
局部名称空间，调用函数时存活，调用完毕后销毁

day16 闭包函数

定义：是内嵌函数，引用了外部名称空间的名字

day17 装饰器

定义：给其他函数添加额外功能的工具

开放封闭原则：对扩展功能开放，对修改内部代码封闭（多处引用，修改可能会导致错乱）

无参装饰器只要两层函数，调用装饰器的时候不能加括号

有参装饰器需要在无参装饰器外面再加一层函数用于接收参数

修正装饰器：

functools模块下提供的一个装饰器，可以让我们在使用装饰器的时候让原函数看起来还和原来一样

from functools import wraps
def timer(func):
    @wraps(func)
    def wrapper(*args,**kwargs):
        start_time=time.time()
        res=func(*args,**kwargs)
        stop_time=time.time()
        print('run time is %s' %(stop_time-start_time))
        return res
    return wrapper

用print（help（func））来判断是否和原函数一致

day18 迭代器+生成器

1 迭代器

可迭代对象：内置有__iter__方法的对象

可迭代对象转换成迭代器对象：使用__iter__方法

迭代器对象：内置有__iter__ ，__next__方法的对象

可迭代对象：列表，字符串，字典，元组，集合，文件对象

迭代器对象：文件对象

迭代器的优点：

为序列和非序列类型提供了一种统一的取值方式
惰性计算，同一时间只存在一个数据，不会影响内存，其他数据类型存就是整体存

迭代器的缺点：

除非取完整个迭代器，不然不知道迭代器长度
无法控制取值，永远只能取下一个，如果要重新开始只能重新定义一个迭代器对象

2 生成器

生成器就是自定义迭代器，有yeild关键字的函数调用不会执行，会返回一个生成器，通过yeild关键字在指定位置挂起函数，通过__next__方法来继续执行函数直到下一次挂起或者return，yeild可以接受参数，也可以和return一样返回参数。

day19 生成式

1 三元表达式

条件成立时运行的代码 if 条件 else 条件不成立时运行的代码

2 生成式

2.1 列表生成式

l = ["a","b","c2","adsa","z"]
#需求：把列表内长度大于1的值添加到新列表new_l中
new_l = [i for i in l if len(i)>1]

2.2 字典生成式

d = {"a":1,"b":2,"c":3} # 这个d只要是个可迭代对象即可
#生成一个新的字典，key是d中的所有key，value为none
new_d = {key:None for key in d }

2.3 集合生成式

# 生成一个包含数字1-9的集合
s ={i for i in range(1,10)}

2.4 生成器表达式

g = (i for i in range(10) if i >3)

day20 匿名函数

1 lambda使用

lambda 参数1,参数2... : 返回值

2 lambda与内置函数的应用

dict1 = {"hz":10011,"lxt":1234,"hzxc":101}
res = max(dict1,key=lambda k:dict1[k])
print(res)

3 map

# 映射：把一个可迭代对象的每一个值拿出来作为函数的参数运行一次，把得到的值合并起来生成一个迭代器
l = [1,2,3,4]
res = map(lambda x:x**2,l)

4 reduce

#reduce函数可以接收三个参数，一个是函数，第二个是可迭代对象，第三个是初始值
from functools import  reduce
l = [1,2,3,4]
res = reduce(lambda x,y:x+y,l,1)
>>> 11
# 如果有初始值就会把初始值作为第一个参数传入，然后取出可迭代对象的第一个值作为第二个参数传入，得到的返回值作为下一次函数运行时的x，再把可迭代对象的第二个参数传入，一直调用函数直到可迭代对象循环结束

5 filter

#过滤列表l
l = [1,2,3,4]
res = filter(lambda x:x>3,l)
#filter会迭代列表l把得到的值传给匿名函数，如果得到结果为真，则过滤出该元素，得到一个迭代器
res >>> 4

day21模块（略）

day22-24 常用模块

1 time模块

time.time() 时间戳：从1970年到现在的秒数
time.strftime() 格式化时间
time.locatime() 结构化时间（共9个元素）

注意：结构化时间可以和时间戳互相转换，结构化时间也可以和格式化时间互相转换

2 datetime模块

datetime.datatime.now()获取当前时间，精确到毫秒，格式化时间

3 random模块

random.random() 取0到1之间的小数
random.randint(1,3) 取大于等于1，小于等于3的整数
random.randrange(1,3) 取大于等于1，小于3的整数
random.choice([1,2,3,4,5,6]) 列表或元组内部随机取一个元素
random.sample([1,2,3,4,5,6]，n) 列表或元组内部随机取n个元素组合成列表
random.uniform(1,3) 取大于1小于3的小数

l1 = [1,2,3,4,5]
random.shuffle(l1)
# 把一个列表打乱

4 os

os.path.getsize(‘文件路径’) 计算该文件大小
os.path.dirname/basename(‘文件路径’) 获得该文件的父级目录/获得该文件的文件名
os.path.isfile(r’文件路径’) 是否是一个存在的文件，返回布尔值
os.path.isdir(r’文件路径’) 是否是一个存在的目录，返回布尔值
os.path.abspath(__file__) 获取当前文件路径
os.path.dirname(‘文件路径’) 获取当前文件路径的父级路径
os.mkdir(‘dirname’) 生成单级目录；相当于shell中mkdir dirname
os.path.exists(‘文件路径’) 如果path存在，返回True；如果path不存在，返回False

5 sys模块

sys.path.append(‘文件路径’) 给环境变量列表添加一个路径

通常用于解决跨文件导包的问题

6 shutil

用于拷贝文件

shutil.copy(文件1，文件2) 拷贝文件和权限
shutil.copy2(文件1，文件2) 拷贝文件和状态信息

7 json&pickle

json.loads(‘数据’) 序列化
json.dumps(‘数据’) 反序列化
pickle.loads(‘数据’) 序列化
pickle.dumps(‘数据’) 反序列化

两者的区别：json序列化成json数据可以供所有语言反序列化，pickle转化成pickle格式只能供python反序列化

8 hashlib

hash算法的模块

hash值的特点：

只要传的值一样，用同样的hash算法得到的hash值必定一样
- 可用于传输密码和验证文件的完整性
不能由hash值反解成原来的内容
只要hash算法不变，无论检验的内容由多大，hash值都是定长

基本操作：

import hashlib
pwd = 123456789
# 实例化md5对象，可以传任意参数，参数会跟着数据一起加密简称 加盐
m = hashlib.md5('盐')
m.update(pwd.encode('utf-8'))
pwd_md5 = m.hexdigest()

最后这里给大家免费分享一份Python学习资料，包含了视频、源码、课件，希望能够帮助到那些不满现状，想提示自己却又没用方向的朋友，也可以和我一起来交流呀！

编辑资料、学习路线图、源代码、软件安装包等！【点击这里】领取！
![在这里插入图片描述](https://i-blog.csdnimg.cn/direct/1caf6cc3f64c43b2be373713c7b101e5.pn