并发-并发挑战及底层实现原理笔记

news2024/11/18 19:36:54

并发编程挑战

上下文切换

  • cpu通过给每个线程分配cpu时间片实现多线程执行,时间片是cpu分配给各个线程的时间,cpu通过不断切换线程执行。
  • 线程有创建和上下文切换的开销。
  • 减少上下文切换的方方法
    – 无锁并发编程,eg:将数据的id按照hash算法取模分段,不同线程处理不同段的数据
    – cas算法:java的atomic包使用cas算法来更新数据,不需要加锁
    – 使用最少的线程:
    – 协程:在单线程里实现多任务的调度,并在单线程里维持了多个任务间的切换

死锁

避免死锁的方法

  • 避免一个线程同时获取多个锁
  • 避免一个线程在锁内同时占用多个资源,尽量保证每个锁只占用一个资源
  • 尝试使用定时锁,使用lock.tryLock(timeout)来替代使用内部锁机制
  • 对于数据库锁,加锁和解锁必须在一个数据库连接里,否则出现解锁失败的情况

资源限制的挑战

资源限制

在进行并发编程时,程序的执行速度受限于计算机硬件资源或软件资源

引起的问题

串行代码变成并发执行时,如果受限于资源,仍然串行执行,不仅不会快反而会更慢,增加了上下文切换和资源调度的时间。
例如:使用多线程在办公网并发地下载和处理数据时,导致cpu利用率达到100%,几个小时都不能运行完成任务,后来修改成单线程,一个小时就执行完成了。

解决方法

  • 硬件资源:考虑集群并行执行程序
  • 软件资源:使用资源池将资源复用

资源限制情况下进行并发编程

将不同的资源限制调整程序的并发度

并发机制的底层实现原理

  • java代码编译后会编程java字节码
  • 字节码被类加载器加载到jvm里,jvm执行字节码,
  • 最终转为汇编指令在cpu上执行

volatile应用

  • 轻量级
  • 保证共享变量的可见性
    • 可见性:当一个线程修改一个共享变量时,另外一个线程能读到这个修改的值。

实现原理

如果一个字段被声明成了volatile,java线程内存模型确保所有线程看到这个变量的值是一致的。

cpu术语
  • 内存屏障:实现对内存操作的顺序限制
  • 缓冲行:缓存中可以分配的最小存储单位
  • 原子操作:不可中断的一个或一系列操作
  • 缓存行填充:当处理器识别到从内存中读取操作数是可缓存的,处理器读取整个缓存行到适当的缓存
  • 缓存命中
  • 写命中
  • 写缺失

Java代码

instance = new Singleton() ;//instance是volatile变量

转成汇编代码

0x01a3de1d:movb $0x0,0x1104800(%esi);0x01a3de24:lock add1 $0x0,(%esp);

Lock前缀的指令在多核处理器引发两件事情

  • 将当前处理器缓存行的数据写回到系统内存
  • 写回内存的操作会使其他cpu里缓存了该内存地址的数据无效

过程

  • 处理器先将系统内存的数据读到内存缓存后再操作
  • 对声明了volatile的变量进行写操作,jvm会向处理器发送一条lock前缀指令,将这个变量所在缓存行的数据协会到系统内存
  • 多处理器下,实现缓存一致性,每个处理器通过嗅探在总线上传播的数据来检查自己缓存的值是不是过期了
  • 处理器发现自己缓存行对应的内存地址被修改,就会将当前处理器缓存行设置成无效状态,当对数据修改操作会重新从内存中把数据读到处理器缓存中。

volatile两条实现原则

  • 缓存锁定:Lock前缀指令会引起处理器缓存会写到内存,Lock#信号一般不锁总线,锁内存。缓存一致性机制会阻止同时修改由两个以上处理器缓存的内存区域数据。
  • 一个处理器的缓存回写到内存会导致其他处理器的缓存无效:处理器使用嗅探技术保证他的内存缓存,系统内存和其他处理器的缓存数据在总线上保持一致。
使用优化

jdk7 并发包中新增了一个队列集合类Linked-TransferQueue,在使用volatile时,用一种追加字节的方式来优化队列出队和入队的性能。

  • LinkedTransferQueue结构

    • 内部类型定义队列的头节点和尾节点
    • 内部类PaddedAtomicReference
  • 追加字节能优化队列出队和入队性能:内部类PaddedAtomicReference相对于父类AtomicReference多了将共享变量追加到64字节(15个变量+父类valule变量)

  • 为什么提高并发编程效率:有些处理器的l1,l2或l3缓存的高速缓存行使64字节宽。追加到64字节填满高速缓冲区的缓存行,避免了头结点和为节点加载到同一个缓存行,使头尾节点在修改时不会互相锁定。

  • 不能使用追加64场景

    • 缓存行非64字节的处理器:eg:P6系列和奔腾处理器,是32字节
    • 共享变量不会被频繁地写

synchronized

synchronized实现同步的基础:Java中的每个对象都可以作为锁

  • 普通同步方法,锁是当前实例对象
  • 静态同步方法,锁是当前类的class对象
  • 同步方法块,锁是synchronized括号里配置的对象

Monitor指令

  • monitorenter指令是在编译后插入到同步代码块的开始位置
  • monitorexit是插入到方法结束处和异常处
  • 任何对象都有一个monitor与之关联,当且一个monitor被持有后,处于锁定状态。
  • 线程执行到monitorenter指令时,将会尝试获取对象对应的monitor所有权,尝试获取对象的锁。

java对象头

synchronized用的锁是存在java对象头里的,如果对象是数组类型,虚拟机用3个字宽存储对象头,如果对象是非数组类型,用2字宽存储对象头。

  • Mark World:存储对象的hashCode,分代年龄和锁标记位

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-oshe1Pci-1692516244748)(C:\Users\DELL\AppData\Roaming\Typora\typora-user-images\image-20230820120519714.png)]

  • Class Metadata Address:存储到对象类型数据的指针

  • Array length:数组的长度(如果当前对象是数组)

锁的升级与对比

  • 锁状态:无锁状态,偏向锁状态,轻量级锁状态,重量级锁状态
  • 锁可以升级但不能降级,目的是为了提高获得锁和释放锁的效率
偏向锁

多数情况下,锁不仅不存在多线程竞争,而且总是由同一个线程多次获得。

**偏向锁撤销:**等到竞争出现才释放锁的机制,当其他线程尝试竞争偏向锁时,持有偏向锁的线程才会释放锁。

  • 无锁:thread1 访问同步块,检查对象头中是否存储了thread1,没有,cas方法替换mark word
  • 偏向锁:成功。将对象头mark word中的线程id指向自己,执行同步体
  • 偏向锁:同时 thread2访问同步块,检查对象头是否存储了thread2,没有,cas替换mark word,不成功,撤销偏向锁
  • 偏向锁撤销:thread1暂停线程,解锁,将线程id设为空,恢复线程

关闭偏向锁

java6和java7中默认启用,但在应用程序启动几秒之后才激活

关闭延迟:-XX:BiasedLockingStartupDelay=0

关闭偏向锁:-XX:-UseBiasedLocking=false

轻量级锁

加锁

  • 线程执行同步块之前,jvm先在当前线程的栈帧中创建用于存储锁记录的空间
  • 将对象头中的mark word复制到锁记录中,
  • 线程尝试使用cas将对象头中的mark word替换为指向锁记录的指针
    • 成功:当前线程获取锁
    • 失败:其他线程竞争锁,当前线程尝试自旋获取锁

解锁

  • cas将displaced mark word 替换回对象头
    • 成功:表示没有竞争发生
    • 失败:当前锁存在竞争,膨胀成重量级锁

轻量级锁膨胀流程

  • 无锁:thread1 和thread2 访问同步块,分配空间并复制mark word 到栈。
  • 轻量级锁:thread1 和thread2 进行cas修改mark word
    • thread1 成功,将mark word替换为轻量级锁,执行同步体
    • thread2 失败,因为thread1获取了锁,thread3自选获取锁
  • 升级为重量级锁:
    • thread2 锁膨胀,修改为重量级锁,线程阻塞
    • thread1 cas替换mark word 失败,因为thread2在争夺锁,thread1释放锁并唤醒等待的线程。
    • thread2线程被唤醒,重新争夺锁访问同步块

当锁处于重量级,其他线程试图获取锁时,会被阻塞,当持有锁的线程释放锁后会唤醒这些线程,被唤醒的线程会进行新一轮的夺锁之争。

优缺点对比

  • 偏向锁
    • 优点:加锁解锁不需额外消耗
    • 缺点:如果线程间存在锁竞争,会带来额外撤销的消耗
    • 场景:适用于只有一个线程访问同步块的场景
  • 轻量级锁
    • 优点:竞争线程不会阻塞,提高响应速度
    • 缺点:如果始终得不到锁竞争的线程,使用自旋会消耗cpu
    • 场景:追求响应时间,同步块执行速度非常快
  • 重量级锁
    • 优点:线程竞争不使用自旋转,不消化cpu
    • 缺点:线程阻塞,响应时间缓慢
    • 场景:追求吞吐量,同步执行速度较长

原子操作的实现原理

术语

  • 缓存行:缓存的最小操作单位
  • 比较并替换(cas):比较旧值是否发生变化,交换成新值,否则不交换
  • cpu流水线:一条x86指令分成56步后有56个不同电路单元分别执行,实现在一个cpu时钟周期完成一条指令。
  • 内存顺序冲突:假共享引起,假共享指多个cpu同时修改同一个缓存行的不同部分引起其中一个cpu的操作无效,当出现这个内存顺序冲突时,cpu需清空流水线

处理器如何实现原子操作

基于对缓存加锁或总线加锁方式实现多处理器之间的原子操作

使用总线锁保证原子性

使用处理器提供的Lock#信号,当一个处理器在总线上输出此信号时,其他处理器的请求将被阻塞住,那么该处理器可以独占共享内存。

总线锁把cpu和内存之间的通信锁住了,其他处理器不能操作其他内存地址的数据,总线锁定的开销比较大。

使用缓存锁保证原子性
  • 频繁使用的内存会缓存在处理器L1,L2和L3高速缓存里。
  • 缓存锁定:内存区域如果被缓存在处理器的缓存行中,并且在Lock操作锁定期间被锁定,那么当他执行锁操作会写到内存时,处理器不在总线上声言LOCK#信号,而是修改内部的内存地址,并允许它的缓存一致性机制来保证操作的原子性。
  • 缓存一致性机制会阻止同时修改由两个以上处理器缓存的内存区域数据,当其他处理器回写已被锁定的缓存行数据时,会使缓存行无效。
  • 不能使用缓存锁定的情况
    • 当操作的数据不能被缓存在处理器内部,或操作的数据跨多个缓存行时,则处理器会调用总线锁定
    • 有些处理器不支持缓存锁定,对于Intel486和Pentium处理器,就算锁定的内存区域在处理器的缓存行中也会调用总线锁定。

java实现原子操作

使用cas实现原子操作
import java.util.ArrayList;
import java.util.List;
import java.util.concurrent.atomic.AtomicInteger;

public class Counter {

    private AtomicInteger atomicInteger = new AtomicInteger(0);

    private int i = 0;

    public static void main(String[] args) {
        final Counter cas = new Counter();
        List<Thread> ts = new ArrayList<Thread>(600);
        long start = System.currentTimeMillis();
        for (int j = 0; j < 100; j++) {
            Thread thread = new Thread(new Runnable() {
                public void run() {
                    for (int i = 0; i < 10000; i++) {
                        cas.count();
                        cas.safeCount();
                    }
                }
            });

            ts.add(thread);
        }
        for (Thread t : ts) {
            t.start();
        }
        //等待所有线程执行完成
        for (Thread t : ts) {
            try {
                t.join();
            } catch (InterruptedException e) {
                e.printStackTrace();
            }
        }
        System.out.println(cas.i);
        System.out.println(cas.atomicInteger.get());
        System.out.println(System.currentTimeMillis()-start);
    }

    private void safeCount(){
        for (;;){
            int i = atomicInteger.get();
            boolean b = atomicInteger.compareAndSet(i, ++i);
            if(b){
                break;
            }
        }
    }

    private void count(){
        i++;
    }
}

执行结果:
在这里插入图片描述

java1.5,jdk提供了一些类支持原子操作:AtomicBoolean,AtomicInteger和AtomicLong

cas三大问题

java并发包中有些并发框架使用了自旋cas方式实现原子操作。

  • ABA
    • 问题:旧值由A变成B再变成A,最终值没变,但实际发生了变化
    • 解决:变量前增加版本号
    • Atomic包中AtomicStampedReference解决ABA问题
      • 先检查当前引用是否等于预期引用,
      • 检查当前标志是否等于预期标志
      • 全部相等更新值
  • 循环时间长开销大:自旋cas长时间不成功,cpu带来非常大的执行开销
    • jvm支持处理器提供的pause指令,效率提升作用
      • 可以延迟流水线执行指令,是cpu不会消耗过多的执行资源,延迟时间取决于具体实现版本
      • 避免在退出循环时因内存顺序冲突,引起cpu流水线被清空,提高执行效率
  • 只能保证一个共享变量原子操作
    • 对多个共享变量操作时,不能保证原子性,可以用锁,或者多个共享变量合成一个共享变量。
    • AtomicReference类保证引用对象之间的原子性,可以把多个变量放到一个对象里进行cas操作
使用锁机制实现原子操作
  • 锁机制保证了只有获得锁的线程能操作锁定的内存区域
  • 偏向锁,轻量锁,互斥锁,除了偏向锁,jvm实现锁的方式都用了循环cas
    • 当一个线程想进入同步块时,使用循环cas的方式来获取锁,当退出同步块的时候使用循环cas释放锁。

参考:Java并发编程的艺术

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/905691.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

CSS中如何实现文字溢出省略号(text-overflow: ellipsis)效果?

聚沙成塔每天进步一点点 ⭐ 专栏简介⭐ CSS中如何实现文字溢出省略号&#xff08;text-overflow: ellipsis&#xff09;效果&#xff1f;⭐ 写在最后 ⭐ 专栏简介 前端入门之旅&#xff1a;探索Web开发的奇妙世界 记得点击上方或者右侧链接订阅本专栏哦 几何带你启航前端之旅 …

16----公式

本节我们来学习如何在markdown中打印公式 Markdown是一种轻量级标记语言&#xff0c;常用于撰写文档、博客和论坛帖子。虽然Markdown本身并不支持数学公式&#xff0c;但可以使用一些扩展来实现公式的显示。在支持公式扩展的 Markdown 解析器中&#xff0c;我们可以使用 Katex …

【核磁共振成像】临床基本通用脉冲序列

目录 一、脉冲序列二、自旋回波(SE)脉冲序列2.1 自旋回波脉冲序列2.2 信噪比、差噪比2.3 采样2.4 改进的自旋回波变型序列 三、反向恢复(IR)脉冲序列3.1 反向恢复脉冲序列3.2 关于反向恢复脉冲序列的改进 四、梯度回波(GE)脉冲序列4.1 GE序列基本概念4.2 三维成像 五、相干稳态…

【Spring Boot 源码学习】自动装配流程源码解析(下)

自动装配流程源码解析&#xff08;下&#xff09; 引言往期内容主要内容4. 排除指定自动配置组件5. 过滤自动配置组件6. 触发自动配置事件 总结 引言 上篇博文&#xff0c;笔者带大家了解了自动装配流程中有关自动配置加载的流程&#xff1b; 本篇将介绍自动装配流程剩余的内…

【Freertos基础入门】同步互斥与通信

提示&#xff1a;文章写完后&#xff0c;目录可以自动生成&#xff0c;如何生成可参考右边的帮助文档 文章目录 前言一、同步互斥与通信是什么&#xff1f;1.基础概念2.freertos通信可用的手段 二、同步与互斥的概念三、各类通信的区别与适用场景总结 前言 本系列基于stm32系列…

wustojc2005中英长度单位换算

#include <stdio.h> int main() {int n, inch;int foot;scanf("%d", &n);foot n /100.0/0.3048;inch (n/100.0/0.3048-foot)*12;printf("%d %d",foot,inch);return 0; }

使用PyMuPDF添加PDF水印

使用Python添加PDF水印的博客文章。 C:\pythoncode\new\pdfwatermark.py 使用Python在PDF中添加水印 在日常工作中&#xff0c;我们经常需要对PDF文件进行处理。其中一项常见的需求是向PDF文件添加水印&#xff0c;以保护文件的版权或标识文件的来源。本文将介绍如何使用Py…

Python自动化测试五种模型

一、前言 在自动化测试中&#xff0c;我们往往将自动化脚本都归纳属于哪种框架模型&#xff0c;比如关键字驱动模型等。 本篇将列举实际自动化测试中&#xff0c;Python 自动化测试的五种模型&#xff1a;线性模型、模块化驱动模型、数据驱动模型、关键字驱动模型、行为驱动模…

大模型框架LangChain开发实战(一)

一、概述 在大模型应用中&#xff0c;通常是基于框架来呼叫模型的&#xff0c;大模型提供了两个最重要的功能&#xff0c;一是提供了具体的intermediate steps&#xff08;即做事情的中间步骤&#xff0c;模型作为reasoning engine&#xff09;&#xff0c;二是提供了evaluati…

vue3实现容器内容滚动到底,触底加载新数据

scroll方式实现 在Vue3中&#xff0c;可以使用ref和onMounted钩子函数获取容器元素并监听滚动事件&#xff0c;判断内容是否滚动到了底部&#xff0c;从而触发加载新数据。 以下是一个简单的示例代码&#xff1a; <template><div class"container" ref&…

Kafka的底层“真面目”

简介 kafka是一个分布式消息队列。具有高性能、持久化、多副本备份、横向扩展能力。生产者往队列里写消息&#xff0c;消费者从队列里取消息进行业务逻辑。一般在架构设计中起到解耦、削峰、异步处理的作用。 kafka对外使用topic的概念&#xff0c;生产者往topic里写消息&…

并查集路径压缩(Java 实例代码)

目录 并查集路径压缩 Java 实例代码 UnionFind3.java 文件代码&#xff1a; 并查集路径压缩 并查集里的 find 函数里可以进行路径压缩&#xff0c;是为了更快速的查找一个点的根节点。对于一个集合树来说&#xff0c;它的根节点下面可以依附着许多的节点&#xff0c;因此&am…

Redis数据结构之String

String 类型是 Redis 的最基本的数据类型&#xff0c;一个 key 对应一个 value&#xff0c;可以理解成与Memcached一模一样的类型。 String 类型是二进制安全的&#xff0c;意思是 Redis 的 String 可以包含任何数据&#xff0c;比如图片或者序列化的对象&#xff0c;一个 Redi…

【Redis从头学-6】Redis中的Hash数据类型实战场景之购物车

&#x1f9d1;‍&#x1f4bb;作者名称&#xff1a;DaenCode &#x1f3a4;作者简介&#xff1a;啥技术都喜欢捣鼓捣鼓&#xff0c;喜欢分享技术、经验、生活。 &#x1f60e;人生感悟&#xff1a;尝尽人生百味&#xff0c;方知世间冷暖。 &#x1f4d6;所属专栏&#xff1a;Re…

如何使用媒体查询(media query)来适配不同设备上的样式?

聚沙成塔每天进步一点点 ⭐ 专栏简介⭐ 使用媒体查询适配不同设备上的样式⭐ 基本语法⭐ 示例⭐ 常见的媒体特性⭐ 创建响应式布局⭐ 写在最后 ⭐ 专栏简介 前端入门之旅&#xff1a;探索Web开发的奇妙世界 记得点击上方或者右侧链接订阅本专栏哦 几何带你启航前端之旅 欢迎来…

(2)、将SpringCache扩展功能封装为starter

(2)、将SpringCache扩展功能封装为starter 1、准备工作 前面我们写了一个common-cache模块,尽可能的将自定义的RedisConnectionFactory, RedisTemplate, RedisCacheManager等Bean封装了起来。 就是为了方便我们将其封装为一个Starter。 我们这里直接《SpringCache+Redis实…

LLM 生成式配置的推理参数温度 top k tokens等 Generative configuration inference parameters

在这个视频中&#xff0c;你将了解一些方法和相关的配置参数&#xff0c;这些参数可以用来影响模型在下一个词生成时的最终决策方式。如果你在Hugging Face网站或AWS的游乐场中使用过LLMs&#xff0c;你可能已经看到了这些控制选项&#xff0c;用来调整LLM的行为。每个模型都暴…

Communication Channels

沟通渠道 n * (n - 1) / 2 你1 相关方3 4 4 * 3 / 2 6 你1 相关方3 相关方1 5 5 * 4 / 2 10 人越多&#xff0c;沟通渠道越多&#xff0c;沟通成本理论越高

Qt文件系统操作和文件的读写

一、文件操作类概述 QIODevice&#xff1a;所有输入输出设备的基础类 QFile&#xff1a;用于文件操作和文件数据读写的类QSaveFile&#xff1a;用于安全保存文件的类QTemporaryFile&#xff1a;用于创建临时文件的类QTcpSocket和QUdpSocket&#xff1a;分别实现了TCP和UDP的类…

CSSCI、北核期刊投稿指南(2023年更新)

该数据为经管类的期刊投稿指南&#xff0c;包含发表难度&#xff0c;文章数量&#xff0c;影响因子&#xff0c;用户评价等指标。共5份文件&#xff0c;分别为国内所有期刊信息库、投稿指南&#xff08;CSSCI版本、CSSCI扩展版本、北大核刊版本、建议期刊版本&#xff09; 一、…