最常用集合 - ArrayList详解

news2024/9/26 5:22:36

ArrayList介绍

ArrayList实现了List接口,是顺序容器,即元素存放的数据与放进去的顺序相同,允许放入null元素,底层通过数组实现。除该类未实现同步外,其余跟Vector大致相同。每个ArrayList都有一个容量(capacity),表示底层数组的实际大小,容器内存储元素的个数不能多于当前容量。当向容器中添加元素时,如果容量不足,容器会自动增大底层数组的大小。

ArrayList 在JDK1.8 前后的实现区别:

  • JDK1.7:像饿汉式,直接创建一个初始容量为10的数组
  • JDK1.8:像懒汉式,一开始创建一个长度为0的数组,当添加add第一个元素时再创建一个初始容量为10的数组

size(), isEmpty(), get(), set()方法均能在常数时间内完成,add()方法的时间开销跟插入位置有关,addAll()方法的时间开销跟添加元素的个数成正比。其余方法大都是线性时间。

为追求效率,ArrayList没有实现同步(synchronized),如果需要多个线程并发访问,用户可以手动同步,也可使用Vector替代

底层原理介绍

底层数据结构

//集合默认容量10;
private static final int DEFAULT_CAPACITY = 10;

//空数组
private static final Object[] EMPTY_ELEMENTDATA = {};

//默认容量的空的数组
private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {};

// 集合中真实存储数据的数组
transient Object[] elementData; // non-private to simplify nested class access

 //集合中元素的个数,注意,这里不是数组的长度
private int size;

构造方法

public ArrayList() {
    //将属性中默认的空的数组赋值给了 存储数据的变量
    this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;
    
    //等价于this.elementData = {}
}

//有参构造
public ArrayList(int initialCapacity) {
    //给定初始容量,就创建一个这个容量大小的数组
   if (initialCapacity > 0) {
        this.elementData = new Object[initialCapacity];
   } else if (initialCapacity == 0) {
        //如果传递的是0 就将{}赋值给elementData 
        this.elementData = EMPTY_ELEMENTDATA;
        //等价于this.elementData = {}
   } else {
        //如果传递的是负数,就会抛异常
        //java.lang.IllegalArgumentException: Illegal Capacity: -20
        throw new IllegalArgumentException("Illegal Capacity: "+ initialCapacity);
   }
}

自动扩容

每当向数组中添加元素时,都要去检查添加后元素的个数是否会超出当前数组的长度,如果超出,数组将会进行扩容,以满足添加数据的需求。

private void grow(int minCapacity) {
    // overflow-conscious code
    int oldCapacity = elementData.length;
    
    //动态扩容,扩容为原来的1.5倍,右移一位即原来的一半
    int newCapacity = oldCapacity + (oldCapacity >> 1);
    if (newCapacity - minCapacity < 0)
        newCapacity = minCapacity;
        
    //判断新容量是否会超过最大限制
    if (newCapacity - MAX_ARRAY_SIZE > 0)
        newCapacity = hugeCapacity(minCapacity);
    // minCapacity is usually close to size, so this is a win:    
    elementData = Arrays.copyOf(elementData, newCapacity);//数组的复制操作
}

扩容方法流程:

  1. 首先获取数组长度

  2. 将数组新容量扩容为原数组容量的1.5倍取整

  3. 将新容量和当前所需最小容量做对比,(最小容量是在add方法中得到的,minCapacity=size+1,即原数组中元素数量加1),而newCapacity=elementData.length*1.5,一般来说肯定是1.5倍比+1的大。但是这里要考虑当数组为空时的情况。数组为空又分为两种情况:①指定了数组容量为0 ②没有显式指定数组大小。

    • 当数组为空时进行插入操作,因为元素个数size为0,数组容量也为0,那么就会进行扩容操作,对于空数组,扩容1.5倍后你的容量还是为0,那么此时就会小于我所需的最小容量(也就是1),此时会令 newCapacity = minCapacity;

    • 而对于①,传入到grow方法的minCapacity = 1 ,因此它扩容后的容量就是1

    • 对于②,在ensureCapacityInternal方法中,使minCapacity = DEFAULT_CAPACITY(10),因此扩容后的数组长度就是DEFAULT_CAPACITY,也就是10。

      • 原因在于在有参构造方法中使this.elementData = EMPTY_ELEMENTDATA;(无参构造方法中this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;),此时在ensureCapacityInternal方法中会对this.elementData进行判断,因此对于①,传入到grow方法的minCapacity = 1;而对于②,minCapacity = Math.max(DEFAULT_CAPACITY, minCapacity),即minCapacity = 10
if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
    //比较大小,此时 minCapacity = 10
    minCapacity = Math.max(DEFAULT_CAPACITY, minCapacity);
}
  1. 最后判断新容量大小是否大于默认数组的最大值(Integer.MAX_VALUE-8),则赋予它整型的最大值
  2. 扩容之后,会调用Arrays.copyOf()方法对数组进行拷贝。

实际上,对数组的copy需要创建一个新数组,并对原数组进行复制的操作,这会造成资源消耗。因此在添加大量元素前,建议使用ensureCapacity操作先增加 ArrayList 实例的容量,先进行稍少量数组数据的copy,再添加元素

add(), addAll()

add 操作可能会导致capacity不足,因此在添加元素之前,都需要进行剩余空间检查,如果需要则自动扩容。扩容操作最终是通过grow()方法完成的。

假设使用的是空参构造,第一次添加元素 add(1)

public boolean add(E e) {
    //确保内部容量 0 + 1
    ensureCapacityInternal(size + 1);  // Increments modCount!!
    //将要添加的元素添加到数组有数据的下一个位置
    elementData[size++] = e;
    return true;
}

private void ensureCapacityInternal(int minCapacity) {//第一次添加: minCapacity = 1
    //有参构造的情况:new Object[10] != {},不会执行if内的语句。即使有参构造给的是0,也不会执行,因为此时elementData = EMPTY_ELEMENTDATA,不等于DEFAULTCAPACITY_EMPTY_ELEMENTDATA
    // 无参构造的情况下:{} = {} 会执行Math.max语句
    if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
    //比较大小,此时 minCapacity = 10
        minCapacity = Math.max(DEFAULT_CAPACITY, minCapacity);
    }
    //明确数组的容量
    ensureExplicitCapacity(minCapacity);
}

private void ensureExplicitCapacity(int minCapacity) {
    modCount++;//记录当前集合操作的次数
    // overflow-conscious code
    if (minCapacity - elementData.length > 0)
        grow(minCapacity);//扩容操作
}

addAll()方法能够一次添加多个元素,根据位置不同也有两个版本,

  • 在末尾添加的addAll(Collection<? extends E> c)方法,

  • 从指定位置开始插入的addAll(int index, Collection<? extends E> c)方法

跟add()方法类似,在插入之前也需要进行空间检查,如果需要则自动扩容;如果从指定位置插入,也会存在移动元素的情况。 addAll()的时间复杂度不仅跟插入元素的多少有关,也跟插入的位置相关。

set()

由于底层是数组,因此set()方法就是直接对数组的指定位置赋值。

public E set(int index, E element) {
    rangeCheck(index);//下标越界检查
    E oldValue = elementData(index);
    elementData[index] = element;//赋值到指定位置,复制的仅仅是引用
    return oldValue;
}

get()

由于底层是数组,get()方法也是直接从数组索引处获取值,唯一要注意的是由于底层数组是Object[],得到元素后需要进行类型转换。

public E get(int index) {
    rangeCheck(index);
    return (E) elementData[index];//注意类型转换
}

remove方法

remove()方法也有两个

  • remove(int index)删除指定位置的元素,

  • remove(Object o)删除第一个满足o.equals(elementData[index])的元素。

删除操作是add()操作的逆过程,会需要将删除点之后的元素向前移动一个位置

public E remove(int index) {
    rangeCheck(index);

    modCount++;
    E oldValue = elementData(index);

    int numMoved = size - index - 1;
    if (numMoved > 0)
    //判断要删除的索引是否是最后一个,,如果不是最后一个,就需要进行数组的复制操作
        System.arraycopy(elementData, index+1, elementData, index,
                             numMoved);
        //然后把最后一个元素置为空,让GC起作用
    elementData[--size] = null; // clear to let GC do its work

    return oldValue;
}

trimToSize()

将底层数组的容量调整为当前列表保存的实际元素的大小的功能

 /**
     * Trims the capacity of this <tt>ArrayList</tt> instance to be the
     * list's current size.  An application can use this operation to minimize
     * the storage of an <tt>ArrayList</tt> instance.
     */
    public void trimToSize() {
        modCount++;
        if (size < elementData.length) {
            elementData = (size == 0)
              ? EMPTY_ELEMENTDATA
              : Arrays.copyOf(elementData, size);
        }
    }

indexOf(), lastIndexOf()

获取元素的第一次出现的index:

public int indexOf(Object o) {
        if (o == null) {
            for (int i = 0; i < size; i++)
                if (elementData[i]==null)
                    return i;
        } else {
            for (int i = 0; i < size; i++)
                if (o.equals(elementData[i]))
                    return i;
        }
        return -1;
    }

获取元素的最后一次出现的index:

public int lastIndexOf(Object o) {
        if (o == null) {
            for (int i = size-1; i >= 0; i--)
                if (elementData[i]==null)
                    return i;
        } else {
            for (int i = size-1; i >= 0; i--)
                if (o.equals(elementData[i]))
                    return i;
        }
        return -1;
    }

遍历时删除(添加)常见陷阱

for循环遍历list

删除某个元素后,list的大小发生了变化,而索引也在变化,所以会导致遍历的时候漏掉某些元素。比如当删除第1个元素后,继续根据索引访问第2个元素时,因为删除的关系后面的元素都往前移动了一位,所以实际访问的是第3个元素。因此,这种方式可以用在删除特定的一个元素时使用,但不适合循环删除多个元素时使用。

for(int i=0;i<list.size();i++){
    if(list.get(i).equals("del"))
        list.remove(i);
}

解决办法:

//从list最后一个元素开始遍历

//从list最后一个元素开始遍历
for(int i=list.size()-1;i>+0;i--){
    if(list.get(i).equals("del"))
        list.remove(i);
}

增强for循环

删除元素后继续循环会抛异常java.util.ConcurrentModificationException,因为元素在使用的时候发生了并发的修改

for(String x:list){
    if(x.equals("del"))
        list.remove(x);
}

解决方法:但只能删除一个"del"元素

//解决:删除完毕马上使用break跳出,则不会触发报错
for(String x:list){
    if (x.equals("del")) {
         list.remove(x);
         break;
    }
}

iterator遍历

这种方式可以正常的循环及删除。但要注意的是,使用iterator的remove方法,如果用list的remove方法同样会报上面提到的ConcurrentModificationException错误。

Iterator<String> it = list.iterator();
while(it.hasNext()){
    String x = it.next();
    if(x.equals("del")){
        it.remove();
    }
}

FailFast机制

上面提到的ConcurrentModificationException异常,都是有这个机制的存在,通过记录modCount参数来实现。在面对并发的修改时,迭代器很快就会完全失败,而不是冒着在将来某个不确定时间发生任意不确定行为的风险。

fail-fast 机制是java集合(Collection)中的一种错误机制。当多个线程对同一个集合的内容进行操作时,就可能会产生fail-fast事件。例如:当某一个线程A通过iterator去遍历某集合的过程中,若该集合的内容被其他线程所改变了;那么线程A遍历集合时,即出现expectedModCount != modCount 时,就会抛出ConcurrentModificationException异常,产生fail-fast事件。

if (modCount != expectedModCount)
    throw new ConcurrentModificationException();

fail-fast 机制并不保证在不同步的修改下抛出异常,他只是尽最大努力去抛出,所以这种机制一般仅用于检测 bug

解决 fail-fast的解决方案:

  1. 在遍历过程中所有涉及到改变modCount值得地方全部加上synchronized或者直接使用Collections.synchronizedList,这样就可以解决(实际上Vector结构就是这样实现的)。但是不推荐,因为增删造成的同步锁可能会阻塞遍历操作。
List<Integer> arrsyn = Collections.synchronizedList(arr);
  1. 使用CopyOnWriteArrayList来替换ArrayList。推荐使用该方案。CopyOnWriteArrayList是兼顾了并发的线程安全

ArrayList和Vector和CopyOnWriteArrayList和LinkedList

继承关系结构图:

ArrayList和Vector和CopyOnWriteArrayList的区别:

  • ArrayList非线程安全的,如果需要考虑到线程安全问题,那么可以使用Vector和CopyOnWriteArrayList;

  • Vector和CopyOnWriteArrayList的区别是:Vector增删改查方法都加了synchronized,保证同步,但是每个方法执行的时候都要去获得锁,性能就会大大下降,而CopyOnWriteArrayList 只是在增删改上加锁,但是读不加锁,在读方面的性能就好于Vector,CopyOnWriteArrayList支持读多写少的并发情况。

ArrayList和LinkedList的区别:

  • ArrayList基于动态数组实现;

  • LinkedList基于链表实现。对于随机index访问的get和set方法,ArrayList的速度要优于LinkedList。因为ArrayList直接通过数组下标直接找到元素;LinkedList要移动指针遍历每个元素直到找到为止。

  • 对于 add(int index, E element),remove(int index)的操作:LinkedList 和 ArrayList的时间复杂度一样,都是O(n);虽然时间复杂度一样,但实际执行时间是不一样的,如下代码所示:

    List<Integer> a = Lists.newArrayList();
    List<Integer> b = Lists.newLinkedList();
    
    Random r = new Random();
    a.add(0);
    b.add(0);
    
    long startTime = System.currentTimeMillis();
    for (int i = 0; i <= 20000; i++) {
        int p = r.nextInt(a.size());
        a.add(p, 0);
    }
    System.out.println(System.currentTimeMillis() - startTime);// 6
    
    startTime = System.currentTimeMillis();
    for (int i = 0; i <= 20000; i++) {
        int p = r.nextInt(b.size());
        b.add(p, 0);
    }
    System.out.println(System.currentTimeMillis() - startTime);// 205
    

    虽然ArrayList在索引位置新增或删除数据时需要移动数据(往前移、往后移),但是在连续内存中的块的数据,是可以操作整片内存的。而LinkedList需要一个一个的先查找到具体索引位置的元素,所以在寻址方面数组的效率高于链表。

  • 对于add新增元素:理论上来说LinkedList的速度(O(1))要优于ArrayList(O(n)),因为ArrayList在新增和删除元素时,可能会扩容和复制数组;LinkedList只需要修改指针即可。但在实际测试中,在数据量小的情况下,两者执行时间几乎一致;增大数据量后,就能看出区别了,如下代码所示:

    List<Integer> a = Lists.newArrayList();
    List<Integer> b = Lists.newLinkedList();
    
    a.add(0);
    b.add(0);
    
    long startTime = System.currentTimeMillis();
    for (int i = 0; i <= 2000000; i++) {
        int p = r.nextInt(a.size());
        a.add(0);
    }
    System.out.println(System.currentTimeMillis() - startTime);// 34
    
    startTime = System.currentTimeMillis();
    for (int i = 0; i <= 2000000; i++) {
        int p = r.nextInt(b.size());
        b.add(0);
    }
    System.out.println(System.currentTimeMillis() - startTime);// 271
    

    这是因为LinkedList 存在一定的性能问题

关于作者

来自一线程序员Seven的探索与实践,持续学习迭代中~

本文已收录于我的个人博客:https://www.seven97.top

公众号:seven97,欢迎关注~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2089529.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

MeshAnything V2来了!30秒生成建模师级Mesh!最大可生成面数提升至1600.

GitHub已揽星1.9k的MeshAnything项目上新了V2版本&#xff0c;由来自南洋理工大学、清华大学、帝国理工学院、西湖大学等研究人员完成。 MeshAnything V2相比V1&#xff0c;使用了最新提出的Adjacent Mesh Tokenization&#xff08;AMT&#xff09;算法&#xff0c;将最大可生…

mysql学习教程,从入门到精通,MySQL介绍(1)

1、MySQL 教程 本教程是为初学者准备的&#xff0c;以帮助他们理解与MySQL语言相关的基础知识和高级概念。 mysql MySQL 是最流行的关系型数据库管理系统&#xff0c;在 WEB 应用方面 MySQL 是最好的 RDBMS(Relational Database Management System&#xff1a;关系数据库管理系…

浏览器的高级搜索

一、背景 通常我们在浏览器搜索内容都是直接在输入框输入我们想要查询的内容&#xff0c;但是这样搜索出来的内容关联性不是很高&#xff0c;很多内容都是与我们搜索内容无关&#xff0c;会浪费我们大量的时间去查找内容。比如&#xff1a;我想要搜索网页中包含《游戏科学》这4…

kafak集群搭建-基于kRaft方式

kafak集群搭建-基于kRaft方式 1、服务器规划2、kafka集群部署配置2.1、解压三个kafka2.2、配置/config/kraft/server.properties 3、启动kafka集群4、SpringBoot集成kafka的kRaft集群4.1、消费者4.2、生产者4.3、配置类4.4、实体类4.5、JSON工具类4.6、项目配置文件4.7、测试类…

【web开发】Spring Boot 快速搭建Web项目

Date: 2024.08.30 13:52:20 author: lijianzhan 简述&#xff1a;【Spring Boot 快速搭建Web项目应用】是一篇关于Java Web项目构建的文章&#xff0c;主要讲解了如何借助Maven工具来管理和构建Web应用程序。Maven是Java开发中广泛使用的自动化构建工具&#xff0c;能够帮助开…

顺序循环队列

顺序循环队列 队头插入元素&#xff0c;队尾删除元素 本来应该判空和判断是否存满的条件都是&#xff1a;队头 队尾&#xff0c;但这样就没办法区分了&#xff0c;所以&#xff0c;就牺牲一个空间&#xff08;比如长度为10&#xff0c;但只能存9个&#xff09;&#xff0c;这…

基层医疗云HIS系统源码:云计算、大数据等现代信息技术研发

云HIS源码&#xff0c;基层云HIS系统源码&#xff0c;基层医疗云HIS系统 利用云计算、大数据等现代信息技术研发的基层医疗云HIS系统实现了医院信息化从局域网向互联网转型&#xff0c;重新定义医疗卫生信息化建设的理念、构架、功能和运维体系。实现了医院信息化由局域网向互…

CAN协议通信 学习笔记

文章目录 1.CAN通信简介2.物理层2.1 CAN总线的电气特性2.2 CAN的位同步机制&#xff08;了解&#xff0c;用于理解CAN的初始化参数的配置原理&#xff09;硬同步方式重新同步方式 2.3 CAN对比其他常用协议的优势 3. 数据链路层3.1 CAN协议的数据帧3.2 仲裁机制3.3 访问控制3.4 …

python-FastApi框架

文章目录 FastApi一. 简介二. 特性三. 安装1. 安装fastapi模块2. 安装ASGI服务器( Uvicorn 或者 Hypercorn) 四. 实例1. 创建**main.py**文件(GET请求)2. 运行3. 测试4. 更新main_py(加入PUT请求) 五. 自动化API文档1. Swagger UI(交互式文档)2. ReDoc(可选式文档) FastApi 一…

华为云征文|Flexus云服务器X,云上性能新飞跃,开启业务增长新纪元

&#x1f3c6;作者简介&#xff0c;黑夜开发者&#xff0c;CSDN领军人物&#xff0c;全栈领域优质创作者✌&#xff0c;CSDN博客专家&#xff0c;阿里云社区专家博主&#xff0c;2023年6月CSDN上海赛道top4。 &#x1f3c6;数年电商行业从业经验&#xff0c;AWS/阿里云资深使用…

想告诉所有人,我找到脸书视频保存方法啦!

各位集美集帅们&#xff0c;我可算找到脸书视频的保存教学啦。作为社媒体人&#xff0c;在脸书看到有趣的素材却保存不了时真的要急的爆炸了。试了好多方式&#xff0c;这软件是最给力哒&#xff0c;我不管&#xff0c;下面的步骤介绍你一定要看完&#xff01; 打开脸书&#x…

JVM面试(一)什么是虚拟机?什么是class文件?

什么是java虚拟机&#xff1f; 如果通俗点来讲&#xff0c;我们在电脑上一行行敲出来的代码&#xff0c;电脑本身是不认识的&#xff0c;最终是要转成电脑可以运行的101001这种字节。 但是这些我们又不可能手动来转换&#xff0c;所以呢&#xff0c;就需要一个工具&#xff0…

关于redis存储数据类型选择

项目使用的spring-boot&#xff0c;操作redis使用的是spring redis的api 在序列化的时候&#xff0c;如果往redis存入的是比较小的数字&#xff0c;反序列化的时候&#xff0c;会是integer类型 如果字段定义的是Long类型&#xff0c;因为比较小&#xff0c;所以被反序列化成i…

Cadence高速板设计技巧(全志H3)

市场上一般的电视屏幕是4K的&#xff1a; cadence查找&#xff1a; 右侧的面板FIND里面输入要查找的名字就可以进行查找。 全局查找需要鼠标点击到.DSN的&#xff0c;进入全局。 在视图里选择一个层就可以单独查看这个层的东西&#xff0c;屏蔽掉其他层的东西&#xff1a; 共…

linux命令:用于删除空目录的命令行工具rmdir详细介绍

目录 一、概述 二、用法 1、基本语法 &#xff08;1&#xff09;选项 &#xff08;2&#xff09;目录... 2、主要选项 &#xff08;1&#xff09;-p, --parents &#xff08;2&#xff09; -v, --verbose &#xff08;3&#xff09; -h, --help &#xff08;4&#x…

Mysql基础练习题 596.查询至少有5个学生的所有班级 (力扣)

596.查询至少有5个学生的所有班级 建表插入数据&#xff1a; Create table If Not Exists Courses (student varchar(255), class varchar(255)) Truncate table Courses insert into Courses (student, class) values (A, Math) insert into Courses (student, class) value…

指针进阶(多级指针)

0.多级指针命名 多级指针命名&#xff0c;最主要的是要知道该指针指向的是什么数据。 一.1级指针 - 指向一个变量 若定义一个变量 int a&#xff0c;那么 目标类型就为 int。 所以该指针应该定义为 int *p; /* 目标 */ int a;/* 目标类型 *p */ int *p;/* 指向目标 */ p a;二…

服务器数据恢复—磁盘坏扇区导致raid6阵列崩溃的数据恢复案例

服务器存储数据恢复环境&#xff1a; 一台存储中有一组由12块SAS硬盘组建的raid6磁盘阵列&#xff0c;划分了1个卷&#xff0c;由数台Vmware ESXI主机共享存储。卷中存放了大量的Windows系统虚拟机。这些虚拟机系统盘大小一致&#xff0c;数据盘大小不确定&#xff0c;数据盘都…

安卓主板_MTK安卓主板定制_联发科主板/开发板方案

这款安卓主板采用了联发科的MTK8788、MTK8768及MTK8766系列芯片平台&#xff0c;运用了64位四核/八核 Cortex-A53/A73架构&#xff0c;主频高达2.0 GHz。主板配置了4GB LPDDR3内存和64GB eMMC存储&#xff0c;同时配备了ARM Mail-T450 MP2图形处理单元(GPU)&#xff0c;使其在4…

PbootCMS程序安全设置建议

近期遇到部分使用PbootCMS开源程序的客户反馈网站被挂马/入侵等情况&#xff0c;我司核实原因是由于此程序存在漏洞&#xff0c;用户可以按照以下建议进行安全设置。 虚拟主机 一、程序建议&#xff1a; 1、登录后台&#xff0c;将程序升级到最新版本&#xff0c;密码重置为…