解释 Java 中的 HashMap 和 ConcurrentHashMap 的区别，以及 HashMap 的线程不安全性？

news2025/2/6 15:36:22

Java中的HashMap和ConcurrentHashMap的区别

HashMap 和 ConcurrentHashMap 是Java中两种常用的Map实现，它们在多线程环境下的表现有很大的不同。

HashMap

HashMap 是非线程安全的，这意味着在多线程环境下使用 HashMap 可能会导致数据不一致或其他并发问题。

代码示例：

import java.util.HashMap;
import java.util.Map;

public class HashMapExample {
    public static void main(String[] args) {
        Map<String, String> map = new HashMap<>();

        // 线程1
        new Thread(() -> {
            for (int i = 0; i < 1000; i++) {
                map.put("key" + i, "value" + i);
            }
        }).start();

        // 线程2
        new Thread(() -> {
            for (int i = 0; i < 1000; i++) {
                map.put("key" + i, "value" + i);
            }
        }).start();

        // 等待两个线程执行完毕
        try {
            Thread.sleep(2000);
        } catch (InterruptedException e) {
            e.printStackTrace();
        }

        System.out.println("HashMap size: " + map.size()); // 可能小于2000
    }
}

问题：

在上面的代码中，两个线程同时对 HashMap 进行写操作，可能会导致数据覆盖或丢失，最终 HashMap 的大小可能小于2000。

ConcurrentHashMap

ConcurrentHashMap 是线程安全的，它在JDK 1.5中引入，设计目的是为了在高并发环境下提供更好的性能。

代码示例：

import java.util.Map;
import java.util.concurrent.ConcurrentHashMap;

public class ConcurrentHashMapExample {
    public static void main(String[] args) {
        Map<String, String> map = new ConcurrentHashMap<>();

        // 线程1
        new Thread(() -> {
            for (int i = 0; i < 1000; i++) {
                map.put("key" + i, "value" + i);
            }
        }).start();

        // 线程2
        new Thread(() -> {
            for (int i = 0; i < 1000; i++) {
                map.put("key" + i, "value" + i);
            }
        }).start();

        // 等待两个线程执行完毕
        try {
            Thread.sleep(2000);
        } catch (InterruptedException e) {
            e.printStackTrace();
        }

        System.out.println("ConcurrentHashMap size: " + map.size()); // 应该是2000
    }
}

优点：

ConcurrentHashMap 通过分段锁（Segment）机制，允许多个线程同时访问不同的段，从而提高了并发性能。
它提供了比 Hashtable 更好的性能，因为 Hashtable 是对整个表进行加锁。

HashMap的线程不安全性

HashMap 的线程不安全性主要体现在以下几个方面：

数据覆盖：多个线程同时写入相同的键时，后写入的值会覆盖先写入的值。
数据丢失：在扩容过程中，如果多个线程同时进行扩容操作，可能会导致部分数据丢失。
死循环：在JDK 1.8之前，HashMap 在多线程环境下可能会导致链表形成环，从而引发死循环。

代码示例：

import java.util.HashMap;
import java.util.Map;

public class HashMapThreadSafetyIssue {
    public static void main(String[] args) {
        Map<Integer, Integer> map = new HashMap<>();

        // 线程1
        new Thread(() -> {
            for (int i = 0; i < 10000; i++) {
                map.put(i, i);
            }
        }).start();

        // 线程2
        new Thread(() -> {
            for (int i = 0; i < 10000; i++) {
                map.put(i, i);
            }
        }).start();

        // 等待两个线程执行完毕
        try {
            Thread.sleep(2000);
        } catch (InterruptedException e) {
            e.printStackTrace();
        }

        System.out.println("HashMap size: " + map.size()); // 可能小于20000
    }
}

日常开发中的合理化使用建议

单线程环境：在单线程环境下，优先使用 HashMap，因为它提供了更好的性能。
多线程环境：在多线程环境下，优先使用 ConcurrentHashMap，以确保线程安全。
读多写少：如果读操作远多于写操作，可以考虑使用 CopyOnWriteArrayList 或 CopyOnWriteArraySet，它们在写操作时会复制整个数组，适用于读多写少的场景。
并发控制：如果需要对 HashMap 进行并发控制，可以使用 Collections.synchronizedMap 包装 HashMap，但性能不如 ConcurrentHashMap。

代码示例：

import java.util.Collections;
import java.util.HashMap;
import java.util.Map;

public class SynchronizedMapExample {
    public static void main(String[] args) {
        Map<String, String> synchronizedMap = Collections.synchronizedMap(new HashMap<>());

        // 线程1
        new Thread(() -> {
            for (int i = 0; i < 1000; i++) {
                synchronizedMap.put("key" + i, "value" + i);
            }
        }).start();

        // 线程2
        new Thread(() -> {
            for (int i = 0; i < 1000; i++) {
                synchronizedMap.put("key" + i, "value" + i);
            }
        }).start();

        // 等待两个线程执行完毕
        try {
            Thread.sleep(2000);
        } catch (InterruptedException e) {
            e.printStackTrace();
        }

        System.out.println("SynchronizedMap size: " + synchronizedMap.size()); // 应该是2000
    }
}

实际开发过程中需要注意的点

避免热点问题：在使用 ConcurrentHashMap 时，尽量避免所有线程都访问同一个段，可以通过调整初始容量和并发级别来优化。
迭代器弱一致性：ConcurrentHashMap 的迭代器是弱一致性的，不会抛出 ConcurrentModificationException，但可能会反映构造后的修改或不反映构造前的修改。
内存一致性：在多线程环境下，使用 ConcurrentHashMap 时要注意内存一致性问题，确保读操作能看到最新的写操作结果。
性能测试：在实际应用中，要对 HashMap 和 ConcurrentHashMap 进行性能测试，选择最适合当前场景的实现。