嗨害大家好鸭!我是爱摸鱼的芝士❤
写在前面不得不看的一些P话:
Python 中多个线程之间是可以共享全局变量的数据的。
但是,多线程共享全局变量是会出问题的。
假设两个线程 t1 和 t2 都要对全局变量g_num (默认是0)进行加1运算,
t1 和 t2 都各对g_num 加10次,g_num 的最终的结果应该为20。
但是由于多线程是同时操作,有可能出现下面情况:
在g_num=0时,t1 取得g_num=0。
此时系统把 t1 调度为”sleeping”状态,
把t2转换为”running”状态,t2 也获得 g_num=0。
然后 t2 对得到的值进行加1并赋给 g_num,
使得g_num=1 。
接着系统又把 t2 调度为”sleeping”,把 t1 转为”running”。
线程t1又把它之前得到的0加1后赋值给g_num。
这样导致虽然 t1 和 t2 都对g_num加1,
但结果仍然是 g_num=1。
先看例子:
import threading
import time
g_num = 0
def work1(num):
global g_num
for i in range(num):
g_num += 1
print("----in work1, g_num is %d---" % g_num)
def work2(num):
global g_num
for i in range(num):
g_num += 1
print("----in work2, g_num is %d---" % g_num)
print("---线程创建之前g_num is %d---" % g_num)
t1 = threading.Thread(target=work1, args=(100,))
t1.start()
t2 = threading.Thread(target=work2, args=(100,))
t2.start()
while len(threading.enumerate()) != 1:
time.sleep(1)
print("2个线程对同一个全局变量操作之后的最终结果是:%s" % g_num)
运行结果:
---线程创建之前g_num is 0---
----in work1, g_num is 100---
----in work2, g_num is 200---
2个线程对同一个全局变量操作之后的最终结果是:200
乍一看,
好像没出什么问题。
那是因为数据太小了,
我们现在把数据变大。
import threading
import time
g_num = 0
def work1(num):
global g_num
for i in range(num):
g_num += 1
print("----in work1, g_num is %d---" % g_num)
def work2(num):
global g_num
for i in range(num):
g_num += 1
print("----in work2, g_num is %d---" % g_num)
print("---线程创建之前g_num is %d---" % g_num)
t1 = threading.Thread(target=work1, args=(1000000,))
t1.start()
t2 = threading.Thread(target=work2, args=(1000000,))
t2.start()
# 确保子线程都运行结束
while len(threading.enumerate()) != 1:
time.sleep(1)
print("2个线程对同一个全局变量操作之后的最终结果是:%s" % g_num)
运行结果:
---线程创建之前g_num is 0---
----in work2, g_num is 1048576---
----in work1, g_num is 1155200---
2个线程对同一个全局变量操作之后的最终结果是:1155200
数越大,
出现问题的概率越大,
而且数据的偏差也越大。
结论
如果多个线程同时对同一个全局变量操作,
会出现资源竞争问题,
从而数据结果会不正确。