一文读懂锁、互斥量、原子操作的并发控制策略

news2024/11/19 6:29:15

前言:在程序设计过程中,难免涉及操作系统、多进程、多线程、数据库等领域。在这些领域内,确保对共享资源的异步操作不出差错,是每个程序开发者必须要考虑的问题。面对并发问题,除了需要谨慎和小心外,引入并发控制策略是解决问题的主要手段,常见的技术有锁、互斥量、信号量、原子操作等。

一、锁(lock)

1.1 概念

锁是一个抽象概念,是一种保护共享资源的同步化技术。锁有两个操作:acquire 和 release。它一次最多只允许一个线程获取,一旦所有权被某一线程获取,其他线程只能等待该线程释放锁才能访问被保护的资源。

1.2 原理

锁的底层实现由硬件的原子指令支持,例如 TAS (Test And Set), CAS (Compare And Swap)。

TAS

TAS 操作向给定的内存地址写入1,并将原始的值返回。如果返回值为0,则更新状态成功成功(可理解为获取锁成功);如果返回值为1,则更新状态失败,说明该共享状态已被其他线程更新。如果使用 TAS 来实现锁,将会是这样:

void Lock(int* lock) {
	while (test_and_set(lock) == 1);
}

这是典型的自旋锁(spinlock)实现方式。

CAS

CAS 相比 TAS 步骤较多,但仍是一个原子操作。首先将给定内存地址的当前值与期望值比较,如果二者相等,则将给定的期望值写到内存地址中。
示例代码:

bool compare_and_swap(int* memory, int expect, int new) {
	if (*memory == expect) {
		*memory = new;
		return true;
	}
	return false;
}

CAS 可以实现互斥锁以及更复杂的自旋锁。

CAS 如何阻止其他线程获取锁?

假设共享状态地址初始值为 0,期望值为 0,new 为当前线程 ID,则当前线程执行 CAS 时,如果状态已被其他线程更新,则 *memory 将为另一线程的 ID,获取锁失败。

事实上,CAS 锁的实现比这复杂得多,其强大之处在于可以根据使用场景自定义上述代码中的 expect 和 new。

内核资料直通车:最新Linux内核源码资料文档+视频资料icon-default.png?t=MBR7https://link.zhihu.com/?target=https%3A//docs.qq.com/doc/DTmFTc29xUGdNSnZ2

学习直通车:Linux内核源码/内存调优/文件系统/进程管理/设备驱动/网络协议栈

1.3 锁的类型

根据线程调度方式(底层实现),可以将锁分为互斥锁和自旋锁。

互斥锁 (Mutex Lock)

一个 CPU 上面的多个线程抢占一把锁,抢占失败的失败的线程会被调度器置位 WAIT (睡眠)状态,直到下一次的 CPU 时间片到来时再次抢占。互斥锁适用于加锁时间较长的场景,此时线程上下文切换带来的开销可以被忽略。

自旋锁 (Spin Lock)

线程获取自旋锁失败后,不会放弃 CPU,会一直处于忙等待状态并持续检查锁是否被释放。适用于加锁时间小于线程切换开销的场景。

数据库中常见的两种锁是悲观锁和乐观锁。

悲观锁 (Pessimistic Lock)

悲观锁的工作方式是在修改数据之前,先锁定再修改,完全防止并发写入。该锁对并发操作持悲观态度,总是做最坏的打算,杜绝并发。

乐观锁 (Optimistic Lock)

乐观锁相对悲观锁没有那么严格。乐观锁假设数据一般情况不会造成冲突,即使当多用户同时修改数据后,只有一条被记录。当数据进行提交更新的时候,如果检测到数据不匹配,此时上报错误信息。乐观锁适用于读多写少的场景,这样可以提高程序的吞吐量。

1.4 锁的粒度

决定锁粒度需要考虑以下几个方面:

  1. 锁的开销:使用锁需要额外的资源,如锁的存储空间、初始化和销毁时间、获取或释放锁的时间。程序使用的锁定越多,与使用相关的开销越多。
  2. 锁的抢占:每当一个进程或线程尝试获取由另一个进程或线程拥有的锁时,就会发生等待或重新调度的开销。锁的粒度越细,抢占导致的开销越低。数据库中对某条记录加锁要好于对整个表加锁。
  3. 死锁:锁的粒度越细,程序中需要使用的锁则越多,逻辑也越复杂,导致死锁的风险也越大。

2 和 3 相互制约,决定锁的粒度是一个权衡过程,应视应用场景而定。

1.5 死锁(deadlock)

当一个线程尝试连续两次获取互斥锁,或多个线程中因为多个互斥锁相互依赖而相互等待时,将产生死锁。

死锁轶事:

新冠疫情期间,某城市健康码服务器宕机,急需程序员前去维修。程序员到达园区门口后,由于无法出示健康码而不能进入园区。死锁发生!

死锁发生时的相互等待(如 A 等待 B,B 等待 C,C 等待 A)有个标志性的特性:锁的循环依赖。高并发程序达到一定规模后,检查是否有死锁的可能性发生尤为重要。其中一个手段就是通过有向图检查是否存在锁的循环依赖。

二、互斥量(Mutex)

Mutex 是词组 MUTual EXclusion 的缩写。与锁不同的是,互斥量更接近底层实现(上述原子操作 CAS, TAS);而锁更加抽象,一般是互斥量的封装或管理器。

除 shared mutex 和 recursive mutex 外,一般互斥量特点是一次只能被一个线程获取所有权,锁定后的状态也只能被该线程释放。互斥量一旦被锁定,任何线程尝试获取该互斥量都讲失败或阻塞(取决于 lock 的实现),包括该线程本身。

递归互斥量(recursive_mutex )允许当前线程获取锁后,在释放之前进一步获取锁,但其他线程无法获取该锁。C++ STL 中对应的实现为 std::recursive_mutex。

三、信号量 (Semaphores)

信号量的关键实现是提供一个机制使多个进程或线程访问和修改的某一资源,同时一个进程(线程)在使用资源后可以通知其他所有等待进程(线程)数据可用。信号量一般是实现了两个原子操作(wait() 和 signal())的整型变量。常见的两种类型是计数信号量(Counting Semaphore) 和 二元信号量(Binary Semaphore)。

计数信号量

将信号量值初始化为系统中需要保护的资源数量,当一个进程(线程)申请获取资源时,执行 wait() 操作使信号量值减少 1;释放资源时,执行任务 signal() 使信号量值加 1。当信号量值为 0 时,表示受保护的系统资源已用尽,此时任何进程(线程)尝试获取资源都会阻塞直到信号量值恢复到大于 0 的状态。

二元信号量

二元信号量值只能为 0 和 1,类似互斥锁具有排他性。信号量值只有为 0 时才能被获取。当某一进程(线程)wait() 信号量并进入临界区后,将信号量值设置为 1,离开临界去后将值恢复为 0 并执行 signal()。

四、互斥量(Mutex)与信号量(Semaphore)的区别

都是访问共享资源的同步化技术,Mutex 是锁机制,Semaphore 是信号机制。

Mutex 更能满足原子化要求。多个线程同时竞争锁时,Mutex 无法保证执行的先后顺序,而 Semaphore 可以通过条件变量对执行顺序进行控制。

Mutex 只能被获取到的线程释放,而 Semaphore 可以被其他线程触发信号(signal() 操作)。

当线程尝试释放未被锁定的 Mutex 锁时,将产生未定义的行为,而 Semaphore 则不会。

五、死锁检测代码

// deadock.c
#define _GNU_SOURCE
#include <dlfcn.h>

#include <unistd.h>
#include <stdint.h>

#include "graph.h"
#define THREAD_NUM 10
typedef unsigned long int uint64;
typedef int (*pthread_mutex_lock_t)(pthread_mutex_t *mutex);
pthread_mutex_lock_t pthread_mutex_lock_f;
typedef int (*pthread_mutex_unlock_t)(pthread_mutex_t *mutex);
pthread_mutex_unlock_t pthread_mutex_unlock_f;

int search_for_cycle(int idx)
{
	struct vertex *ver = &tg->list[idx];
	visited[idx] = 1;
	k = 0;
	path[k++] = idx;

	while (ver->next != NULL) {
		int i = 0;
		for (i = 0; i < tg->num; i++) {
			if (i == idx)
				continue;
			visited[i] = 0;
		}

		for (i = 1; i <= MAX; i++) {
			path[i] = -1;
		}
		k = 1;

		DFS(search_vertex(ver->next->s));
		ver = ver->next;
	}
	return 0;
}


void check_dead_lock(void)
{
	int i = 0;

	deadlock = 0;
	for (i = 0; i < tg->num; i++) {
		if (deadlock == 1)
			break;
		search_for_cycle(i);
	}

	if (deadlock == 0) {
		printf("no deadlock\n");
	}
}

static void *thread_routine(void *args)
{
	while (1) {
		sleep(5);
		check_dead_lock();
	}
}

void start_check(void)
{
	tg = (struct task_graph *)malloc(sizeof(struct task_graph));
	tg->num = 0;
	tg->lockidx = 0;

	pthread_t tid;

	pthread_create(&tid, NULL, thread_routine, NULL);
}

int search_lock(uint64 lock)
{
	int i = 0;

	for (i = 0; i < tg->lockidx; i++) {
		if (tg->locklist[i].lock_id == lock) {
			return i;
		}
	}

	return -1;
}

int search_empty_lock(uint64 lock)
{
	int i = 0;

	for (i = 0; i < tg->lockidx; i++) {
		if (tg->locklist[i].lock_id == 0) {
			return i;
		}
	}

	return tg->lockidx;
}

int inc(int *value, int add)
{
    // 实现原子操作,fatch_add
	int old;
	__asm__ volatile(
		"lock;xaddl %2, %1;"
		: "=a"(old)
		: "m"(*value), "a"(add)
		: "cc", "memory");

	return old;
}

void print_locklist(void)
{
	int i = 0;

	printf("print_locklist: \n");
	printf("---------------------\n");
	for (i = 0; i < tg->lockidx; i++) {
		printf("threadid : %ld, lockid: %ld\n", tg->locklist[i].id, tg->locklist[i].lock_id);
	}
	printf("---------------------\n\n\n");
}

void lock_before(uint64 thread_id, uint64 lockaddr)
{
	int idx = 0;
	// list<threadid, toThreadid>

	for (idx = 0; idx < tg->lockidx; idx++) {
		if ((tg->locklist[idx].lock_id == lockaddr)) {
			struct source_type from;
			from.id = thread_id;
			from.type = PROCESS;
			add_vertex(from);

			struct source_type to;
			to.id = tg->locklist[idx].id;
			tg->locklist[idx].degress++;
			to.type = PROCESS;
			add_vertex(to);

			if (!verify_edge(from, to)) {
				add_edge(from, to); //
			}
		}
	}
}

void lock_after(uint64 thread_id, uint64 lockaddr)
{
	int idx = 0;
	if (-1 == (idx = search_lock(lockaddr))) { // lock list opera

		int eidx = search_empty_lock(lockaddr);

		tg->locklist[eidx].id = thread_id;
		tg->locklist[eidx].lock_id = lockaddr;

		inc(&tg->lockidx, 1);
	}
	else {
		struct source_type from;
		from.id = thread_id;
		from.type = PROCESS;

		struct source_type to;
		to.id = tg->locklist[idx].id;
		tg->locklist[idx].degress--;
		to.type = PROCESS;

		if (verify_edge(from, to))
			remove_edge(from, to);

		tg->locklist[idx].id = thread_id;
	}
}

void unlock_after(uint64 thread_id, uint64 lockaddr)
{
	int idx = search_lock(lockaddr);

	if (tg->locklist[idx].degress == 0) {
		tg->locklist[idx].id = 0;
		tg->locklist[idx].lock_id = 0;
	}
}

int pthread_mutex_lock(pthread_mutex_t *mutex)
{
	pthread_t selfid = pthread_self(); //

	lock_before(selfid, (uint64)mutex);
	pthread_mutex_lock_f(mutex);
	lock_after(selfid, (uint64)mutex);

	return 0;
}

int pthread_mutex_unlock(pthread_mutex_t *mutex)
{
	pthread_t selfid = pthread_self();

	pthread_mutex_unlock_f(mutex);
	unlock_after(selfid, (uint64)mutex);

	return 0;
}

static int init_hook()
{
    // 使用钩子劫持库函数 pthread_mutex_(un)lock
    // 在获取和释放锁时,获取锁 ID 和线程 ID
	pthread_mutex_lock_f = dlsym(RTLD_NEXT, "pthread_mutex_lock");
	pthread_mutex_unlock_f = dlsym(RTLD_NEXT, "pthread_mutex_unlock");
	return 0;
}

int main()
{
    // create oriented graph 
	tg = (struct task_graph *)malloc(sizeof(struct task_graph));
	tg->num = 0;

	struct source_type v1;
	v1.id = 1;
	v1.type = PROCESS;
	add_vertex(v1);

	struct source_type v2;
	v2.id = 2;
	v2.type = PROCESS;
	add_vertex(v2);

	struct source_type v3;
	v3.id = 3;
	v3.type = PROCESS;
	add_vertex(v3);

	struct source_type v4;
	v4.id = 4;
	v4.type = PROCESS;
	add_vertex(v4);

	struct source_type v5;
	v5.id = 5;
	v5.type = PROCESS;
	add_vertex(v5);

	add_edge(v1, v2);
	add_edge(v2, v3);
	add_edge(v3, v4);
	add_edge(v4, v5);
	add_edge(v3, v1);

	search_for_cycle(search_vertex(v1));
}
// output: deadlock : 1 --> 2 --> 3 --> 1

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/124970.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

《图解TCP/IP》阅读笔记(第七章 7.7)——MPLS 多协议标记交换技术

7.7 MPLS 由小而大的讲完了三种路由协议RIP、OSPF、BGP之后&#xff0c;我们来看在转发IP数据包时使用到的另外一种技术——标记交换技术。 路由技术基于IP地址中的最长匹配原则进行转发&#xff0c;而标记交换则对每个IP包都设定一个叫做“标记”的值&#xff0c;根据该标记…

数据结构与算法-堆

什么堆 堆是一种特殊的数据结构&#xff0c;是最高效的优先级队列。可以被看作是一颗完全的二叉树表达的数组对象。 堆的定义 1、必须是一颗完全二叉树 完全二叉树就是子节点必须从左到右都是完整的&#xff0c;没有缺失。 2、用数组表示看作完全二叉树的堆 假设&#xff1a…

基于MYSQL的互联网药品交易系统数据库设计项目实战

说明&#xff1a;这是一个数据库课程设计实战项目&#xff08;附带代码文档视频讲解&#xff09;&#xff0c;如需代码文档视频讲解可以直接到文章最后获取。 项目背景 疫情期间实体经济收到打击&#xff0c;实体药店经营困难&#xff0c;医院也面临着疫情患者的压力运转着&…

window安装Docker Desktop for Windows(基于WSL2)

目录一 什么是Ducker二 安装Ducker1 window for Linux子系统环境搭建1.1 打开系统虚拟机平台和WSL(适用于Linux的window子系统)1.2安装WSL21.3为什么用wsl2&#xff0c;不用wsl11.4 下载集成支持linux内核的wsl21.5 设置WSL默认版本二、安装Ubuntu20.04LTS1 打开Microsoft Stor…

解析某音短视频X-Bogus

文章目录写在前面目标正向梳理主要加密函数主要算法解析逆向梳理结论测试进阶写在后面写在前面 首先推荐一篇资料&#xff1a; 某音短视频 X-Bogus 逆向分析&#xff0c;JSVMP 纯算法还原 这篇文章介绍了通过插桩日志抠算法的过程&#xff0c;很有参考价值。 文章已经实现的部…

什么是外汇跟单?外汇MT4自动跟单系统靠谱吗?

对于很多刚刚进入外汇市场的新手投资者而言&#xff0c;必须踏踏实实学习基础知识和交易技巧&#xff0c;才能在外汇市场获取盈利&#xff0c;因为在没有任何专业知识的情况下&#xff0c;想要在外汇市场盈利是一件非常艰难的事情。而一些脑洞大开的外汇新手投资者却在思考&…

第7章 分页之模型分页(物理分页)

模型分页主要通过前端页面中的分页控件&#xff0c;向后端指定路由(控制器行为方法)&#xff0c;传递相等的参数&#xff0c;然后间接的通过后端程序从数据库指定表中获取一些指定行的数据&#xff0c;然后把这些数据在前端页面渲染显示出来。模型分页的主要用于前端页面与后端…

Java开发 - 数据库索引的数据结构

目录 前言 题外话 什么是索引 索引的使用场景 索引的失效瞬间 索引的数据结构 Tree BTree BTree 索引提高查询效率的原因 索引的分类 innodb的特点 聚簇索引 非聚簇索引 索引操作 创建索引 查询索引 删除索引 外键 结语 前言 上一章中讲解了慢sql优化的方…

快速诊断I/O性能问题

背景客户反馈最近一段时间数据库运行缓慢&#xff0c;磁盘的压力很大&#xff0c;现在有两种不同的分析结论&#xff0c;存储设备性能下降和数据库压力变大&#xff0c;请我们进行系统的分析&#xff0c;给一个结论 现象 登录SQL专家云&#xff0c;进入性能指标页面&#xff0c…

跨境电商小白:一件代发是什么?为什么要选择Starday一件代发?

近两年经济形势比较复杂多变&#xff0c;许多人面临就业难、职场改革、行业转型等困境&#xff0c;而跨境电商行业在此形势下依靠着国家优惠政策以及中国高质量产品在海外市场获得越来越多的份额。随着跨境电商行业发展规模的扩大&#xff0c;越来越多人选择加入到跨境电商赛道…

【实时数仓】省份交易额统计接口、新老访客对比接口、访客分时统计接口

文章目录一 省份交易额统计接口1 Sugar配置&#xff08;1&#xff09;图表配置&#xff08;2&#xff09;接口地址&#xff08;3&#xff09;数据格式&#xff08;4&#xff09;执行SQL2 数据接口实现&#xff08;1&#xff09;创建地区交易额统计实体类ProvinceStats&#xff…

Kafka基础_2

Kafka系列 注&#xff1a;大家觉得博客好的话&#xff0c;别忘了点赞收藏呀&#xff0c;本人每周都会更新关于人工智能和大数据相关的内容&#xff0c;内容多为原创&#xff0c;Python Java Scala SQL 代码&#xff0c;CV NLP 推荐系统等&#xff0c;Spark Flink Kafka Hbase …

18-RocketMQ源码解读

NameServer启动 1、功能回顾 NameServer的核心作用 一是维护Broker的服务地址并进行及时的更新。 二是给Producer和Consumer提供服务获取Broker列表。 2、启动流程-源码重点 整个NameServer的核心就是一个NamesrvController对象。这个controller对象就跟java Web开发中的Contr…

3D可视化大屏是如何实现的?

3D可视化是指拥有3D效果的数据可视化&#xff0c;对于所要展示的数据可视化内容还原出真实场景&#xff0c;并实时接入数据&#xff0c;在面对复杂操作时灵活应对&#xff0c;使得整个场景在大屏上的展示更具立体、更具科技感、更具易用性。 物联网时代&#xff0c;可视化大屏的…

【发表案例】传感器网络及电路类,仅1个月26天录用

【期刊简介】IF&#xff1a;1.0-2.0&#xff0c;JCR4区&#xff0c;中科院4区 【检索情况】SCI 在检&#xff0c;正刊 【征稿领域】自主传感器网络的高级接口电路及其应用 【参考周期】2个月左右录用 【截稿日期】2023.1.31 重要时间节点&#xff1a;仅1个月26天录用 2022/12…

神经网络中常用的权重初始化方法及为何不能全初始化为0

1.权重初始化的重要性 神经网络的训练过程中的参数学习时基于梯度下降算法进行优化的。梯度下降法需要在开始训练时给每个参数赋予一个初始值。这个初始值的选取十分重要。在神经网络的训练中如果将权重全部初始化为0&#xff0c;则第一遍前向传播过程中&#xff0c;所有隐藏层…

深度学习笔记:感知机

感知机&#xff08;perceptron&#xff09;为神经网络的起源算法。感知机接受多个输入信号&#xff0c;输出一个信号。感知机信号只有0和1。 在上图的感知机中&#xff0c;x1和x2两个输入信号会分别乘以其对应权重(weight) w1和w2&#xff0c;传入神经元。神经元计算传来信号综…

Disentangled Face Attribute Editing via Instance-Aware Latent Space Search翻译

论文地址 代码地址 摘要 最近的研究表明&#xff0c;生成对抗网络&#xff08;GAN&#xff09;的潜空间中存在一组丰富的语义方向&#xff0c;这使得各种面部属性编辑应用成为可能。然而&#xff0c;现有的方法可能会遇到属性变化不好的问题&#xff0c;从而导致在更改所需属…

JS中数组对象使用

文章目录一、创建数组对象二、数组翻转1.检测数组2.翻转数组&#xff1a;三、添加数组元素1.push方法2.unshift方法四、删除数组元素1.pop方法2.shift方法&#x1f918;案例1五、数组排序六、数组索引方法1.indexof(数组元素)2.lastIndexOf方法&#x1f91f;案例2七、数组转化为…

数字验证学习笔记——SystemVerilog芯片验证16 ——约束控制块随机函数

一、约束块控制 一个类可以包含多个约束块。可以把不同约束块用于不同测试。一般情况下&#xff0c;各个约束块之间的约束内容是互相协调不违背的&#xff0c;因此通过随机函数产生随机数时可以找到合适的解 如果子类继承父类&#xff0c;也继承了父类的约束&#xff0c;这个时…