如何使用 arrayList.removeAll(Collection<?> c)?

news2025/2/28 12:43:04

引言

对于 Collection 集合及其实现类都有 removeAll(Collection<?> c)

对于ArrayList 的实例对象,在数据比较多的情况下,方法 removeAll() 的传参 c 的类型是 HashSet会比是 ArrayList 的情况快的多。

原因

我们来细看一下ArrayList类的removeAll()方法实现的伪代码。

如:arrayList.removeAll(subList);

// 遍历底层数组,将不需要删除的元素放在数组前面,后面的全部置为 null
// w 为要删除和不删除的分界线
int w = 0;
for(var value in 该 arrayList 的底层数组){
    if(!subList.contains(value)){
        该 arrayList 的底层数组 [w] = value;
        w++;
    }
}

这里影响速率关键的一步是:subList.contains(value)

这是因为contains()方法在不同类中的实现是存在差异的。

对于 ArrayList.contains(),它的实现是调用 indexOf(),一个一个地遍历查找。最坏时间复杂度为O(总数据量)。

而对于 HashSet.contains(),由于 HashSet 的底层是 HashMap,因此实际调用的是 HashMapcontainsKey()方法,该方法是通过哈希计算的方式去查询的,因此速度十分快。最坏的时间复杂度约为O(最长链表长度),而链表长度一般不会过大。

使用方法

在数据量比较大的的情况下,使用arrayList.removeAll(subList)时,可以将subList封装为HashSet

arrayList.removeAll(new HashSet(subList));

速度实测:

数据量ArrayListHashSetLinkedList
10 万1094 毫秒6 毫秒1133 毫秒
20 万4140毫秒8 毫秒4241 毫秒
50 万51431毫秒30 毫秒34380 毫秒
100 万140444 毫秒36 毫秒179465 毫秒
500 万9130706 毫秒79 毫秒10549229 毫秒

测试用的代码:

public class RemoveAllTest {
    public static void main(String[] args) {
        ArrayList<Integer> arrayList = new ArrayList<>();
        for (int i = 0; i < 5000000; i++) {
            arrayList.add(i);
        }
        ArrayList<Integer> subList = new ArrayList<>();
        for (int i = 0; i < 5000000; i++) {
            subList.add(i);
            i += 2;
        }
        // 测试入参为 ArrayList 类型时 removeAll() 的性能
        long startTime = System.currentTimeMillis();
        arrayList.removeAll(subList);
        long endTime = System.currentTimeMillis();
        System.out.println("ArrayList 耗时:" + (endTime - startTime));

        // 测试入参为 HashSet 类型时 removeAll() 的性能
        ArrayList<Integer> arrayList2 = new ArrayList<>();
        for (int i = 0; i < 5000000; i++) {
            arrayList2.add(i);
        }
        startTime = System.currentTimeMillis();
        arrayList2.removeAll(new HashSet<>(subList));
        endTime = System.currentTimeMillis();
        System.out.println("HashSet 耗时:" + (endTime - startTime));

        // 测试将 ArrayList 类型转成 LinkedList 类型
        ArrayList<Integer> arrayList3 = new ArrayList<>();
        for (int i = 0; i < 5000000; i++) {
            arrayList3.add(i);
        }
        startTime = System.currentTimeMillis();
        new LinkedList(arrayList3).removeAll(subList);
        endTime = System.currentTimeMillis();
        System.out.println("LinkedList 耗时:" + (endTime - startTime));
    }
}

HashSet 、LinkedList 中 removeAll() 方法的区别

在这里插入图片描述

不同类的 removeAll() 方法实现不同,可以看到对于 HashSetLinkedList,他们的 removeAll() 方法是通过父类或超父类的迭代器进行实现的,而 ArrayList 是自己通过 for 循环进行了实现。

HashSet 内部实现

依托于 AbstractSet 类的 removeAll(Collection<?> c) 方法,实现的逻辑是:

先调原集合对象 HashSetremoveAll(Collection<?> c) 方法中传入的参数 c 的 size() 方法,用来判断谁包含的元素更多。

  • 如果原集合对象的元素数量 > c 中元素数量,那么调用 c 的代器去遍历 c ,查看元素是否包含在原集合中,并使用原集合的 remove() 方法去删除元素。时间复杂度为 O(n)。

  • 如果原集合对象的元素数量 < c 中元素数量,那么调用原集合对象的迭代器去遍历原集合,检查元素是否包含在 c 中,并调用原集合迭代器的 remove() 方法去删除元素。这里的时间复杂度与集合 c 的 contains() 方法的实现有关:

    • 如果 c 是一个 ArrayListcontains() 方法的时间复杂度是 O( m )。因此,从集合 HashSet 中删除 ArrayList 中存在的所有元素的总体时间复杂度为 O( n * m )。

    • 如果 c 再次是 HashSet,则 contains() 方法的时间复杂度为 O(1)。因此,从集合 HashSet 中删除 HashSet 中存在的所有元素的总体时间复杂度为 O( n )。

public boolean removeAll(Collection<?> c) {
    Objects.requireNonNull(c);
    boolean modified = false;

    if (size() > c.size()) {
        for (Iterator<?> i = c.iterator(); i.hasNext(); )
            modified |= remove(i.next());
    } else {
        for (Iterator<?> i = iterator(); i.hasNext(); ) {
            if (c.contains(i.next())) {
                i.remove();
                modified = true;
            }
        }
    }
    return modified;
}

LinkedList 内部实现

public boolean removeAll(Collection<?> c) {
    Objects.requireNonNull(c);
    boolean modified = false;
    Iterator<?> it = iterator();
    while (it.hasNext()) {
        if (c.contains(it.next())) {
            it.remove();
            modified = true;
        }
    }
    return modified;
}

通过 contains() 方法来判断是否存在相同的元素,效率与 c 的类型有关。

参考

  • 为什么arrayList.removeAll(set)的速度远高于arrayList.removeAll(list)?

  • Java 中 HashSet 的 removeAll 性能分析

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1087206.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

redis简介和配置教程

redis简洁版教程 一、概述1、简介2、特点3、优势 二、配置 一、概述 1、简介 Redis是一个高性能的 key-value 数据库。 2、特点 Redis支持数据的持久化&#xff0c;可以将内存中的数据保存在磁盘中&#xff0c;重启的时候可以再次加载进行使用。Redis不仅仅支持简单的key-v…

矩阵系统能做什么

矩阵系统可以应用于许多领域&#xff0c;包括但不限于以下方面&#xff1a; 1. 工程领域&#xff1a;在工程项目中&#xff0c;矩阵系统可用于设计和优化结构、系统、网络、电路、热管理等。例如&#xff0c;矩阵系统可以用来分析和预测系统的稳定性、可靠性、响应时间、能耗等…

C++如何让自己变得富有?

&#x1f388;个人主页:&#x1f388; :✨✨✨初阶牛✨✨✨ &#x1f43b;强烈推荐优质专栏: &#x1f354;&#x1f35f;&#x1f32f;C的世界(持续更新中) &#x1f43b;推荐专栏1: &#x1f354;&#x1f35f;&#x1f32f;C语言初阶 &#x1f43b;推荐专栏2: &#x1f354;…

多输入多输出 | MATLAB实现CNN-BiGRU-Attention卷积神经网络-双向门控循环单元结合SE注意力机制的多输入多输出预测

多输入多输出 | MATLAB实现CNN-BiGRU-Attention卷积神经网络-双向门控循环单元结合SE注意力机制的多输入多输出预测 目录 多输入多输出 | MATLAB实现CNN-BiGRU-Attention卷积神经网络-双向门控循环单元结合SE注意力机制的多输入多输出预测预测效果基本介绍程序设计往期精彩参考…

Newman基本使用

目录 简介 安装 使用 官网 运行 输出测试报告文件 htmlextra 使用 简介 Newman 是 Postman 推出的一个 nodejs 库&#xff0c;直接来说就是 Postman 的json文件可以在命令行执行的插件。   Newman 可以方便地运行和测试集合&#xff0c;并用之构造接口自动化测试和持续集成…

基于Java的宠物医院管理系统设计与实现(源码+lw+部署文档+讲解等)

文章目录 前言主要功能:具体实现截图论文参考详细视频演示为什么选择我自己的网站自己的小程序&#xff08;小蔡coding&#xff09;有保障的售后福利 代码参考源码获取 前言 &#x1f497;博主介绍&#xff1a;✌全网粉丝10W,CSDN特邀作者、博客专家、CSDN新星计划导师、全栈领…

mysql面试题47:MySQL中Innodb的事务实现原理

该文章专注于面试,面试只要回答关键点即可,不需要对框架有非常深入的回答,如果你想应付面试,是足够了,抓住关键点 面试官:Innodb的事务实现原理 InnoDB是MySQL中一种常用的存储引擎,它支持事务和行级锁等特性。以下是InnoDB事务实现的简要原理: 事务定义: 事务是指一…

【算法系列 | 10】深入解析查找算法之—线性查找

序言 心若有阳光&#xff0c;你便会看见这个世界有那么多美好值得期待和向往。 决定开一个算法专栏&#xff0c;希望能帮助大家很好的了解算法。主要深入解析每个算法&#xff0c;从概念到示例。 我们一起努力&#xff0c;成为更好的自己&#xff01; 今天第10讲&#xff0c;讲…

上机实验二 设计单循环链表 西安石油大学数据结构

实验名称:设计单循环链表 (1&#xff09;实验目的:掌握线性表的链式存储结构;掌握单循环链表及其基本操作的实现。 (2&#xff09;主要内容:实现单循环链表的初始化、求数据元素个数、插入、删除、取数据元素等操作;用插入法建立带头结点的单循环链表;设计一个测试主函数验证…

Sprint framework Day07:注解结合 xml 配置

前言 Spring注解结合XML配置是指在Spring应用中&#xff0c;使用注解和XML配置的方式来进行Bean的定义、依赖注入和其他配置。这种方式可以充分利用Spring框架的注解和XML配置两种不同的配置方式的特点。 在Spring框架中&#xff0c;我们可以使用注解来定义Bean&#xff0c;如…

后端:推荐 2 个 .NET 操作的 Redis 客户端类库

目录 Redis特点 Redis场景 1. StackExchange.Redis 2. FreeRedis &#x1f680; 快速入门 &#x1f3a3; Master-Slave (读写分离) &#x1f4bb; Pipeline (管道)示例 &#x1f30c; Redis Cluster (集群) Redis &#xff0c;是一个高性能(NOSQL)的key-value数据库,Re…

【linux进程(四)】僵尸进程和孤儿进程概念进程优先级讲解

&#x1f493;博主CSDN主页:杭电码农-NEO&#x1f493;   ⏩专栏分类:Linux从入门到精通⏪   &#x1f69a;代码仓库:NEO的学习日记&#x1f69a;   &#x1f339;关注我&#x1faf5;带你学更多操作系统知识   &#x1f51d;&#x1f51d; 进程优先级 1. 前言2. 什么是…

快递查询神器:一键筛选超时快递的方法揭秘

快递服务的快速发展&#xff0c;为我们的生活带来了极大的方便。然而&#xff0c;由于各种原因&#xff0c;有时候我们会遇到快递超时的情况&#xff0c;这给我们的生活带来了一些困扰。但是&#xff0c;现在有了一款神奇的快递查询助手软件&#xff0c;能够一键筛选超时快递&a…

上传文件夹里面的文件后,按树结构的table表格展示

1. 先处理最简单的 原始数据大概是这样: let fileArr [{progress: 100,status: 成功,type: 通号,webkitRelativePath: "六捷数据2023-05-04 163909/G163/Abis口详细信息_(G163)(380BL3544-0)(14984173988)(2018-01-24 174431.0740—2018-01-24 180347.9070).xls"…

Node.js 正在逐渐被淘汰!Bun 1.0 正在改变 JavaScript 的游戏规则

在深入讨论之前&#xff0c;我们需要解释什么是 JavaScript 运行时以及为什么我们应该关心其速度。 想象一下&#xff0c;你用 JavaScript 写了一个故事&#xff0c;需要有人大声读出来。JavaScript 运行时就像是那个友好的叙述者&#xff0c;为你的故事赋予生命&#xff01;它…

vue实时显示当前年月日时分秒有时间单位的<script setup>写法

在Vue 3中&#xff0c;您可以使用<script setup>语法来编写实时显示当前年月日时分秒并显示时间单位的代码。以下是一个示例&#xff1a; <template> <div> 当前时间&#xff1a;{{ currentDateTime }} </div> </template><script setup>…

el-table 表格里面有tree 层级 进行勾选和反勾选

// 勾选全选反勾选等实现setChecked(data) {for (let i 0; i < data.length; i) {const node data[i];if (node.isCheck) {// 如果当前节点被勾选&#xff0c;将其子节点全部设置为选中状态if(node.children) {for (let j 0; j < node.children.length; j) {const chi…

十三、前端开发知识快速入门

目录 一、HTML概述和基本结构1.1 概述1.2 基本结构1.3 html文档类型1.4 html注释 二、HTML常用标签2.1 块标签2.2 行内标签2.3 字符实体2.4 图片标签2.5 链接标签2.6 列表标签2.7 表单2.8 表格 三、页面布局四、CSS样式4.1 基本语法和页面引用4.2 文本样式设置4.3 颜色表示法4.…

asp.net会议预约管理系统VS开发sqlserver数据库web结构c#编程Microsoft Visual Studio

一、源码特点 asp.net 会议预约管理系统 是一套完善的web设计管理系统&#xff0c;系统具有完整的源代码和数据库&#xff0c;系统主要采用B/S模式开发。开发环境为vs2010&#xff0c;数据库为sqlserver2008&#xff0c;使用c#语 言开发 asp.net 会议预约管理系统 二、…

ES _bulk 批量操作用法

es 的 bulk 操作&#xff0c;是用来批量发送请求&#xff0c;或者理解为批量操作的。 支持4种操作 bulk 支持多种操作&#xff0c;如下create、index、update、delete。 create 如果文档不存在就创建&#xff0c;但如果文档存在就返回错误index 如果文档不存在就创建&#x…