HashSet 是 Java 中的一个集合类,它实现了 Set 接口。Set 是一种不允许包含重复元素的集合,而 HashSet 则是 Set 接口的一个具体实现。因此,HashSet 用于存储一组唯一的元素,不允许重复。
HashSet 的一些特点:
- 不允许重复元素:如果试图向 HashSet 中添加重复的元素,重复元素将被忽略。
- 无序性:HashSet 不保证元素的顺序,元素在 HashSet 中是无序的。
- 允许 null 元素:HashSet 可以包含一个 null 元素。
基本操作
创建和初始化HashSet
Set<String> fruits = new HashSet<>();
Set<String> set = new HashSet<>(List.of("a","b","c","a"))
添加元素
Set<String> fruits = new HashSet<>();
fruits.add("苹果");
fruits.add("香蕉");
fruits.add("梨子");
删除元素
fruits.remove("苹果");
判断元素是否存在
fruits.contains("苹果");
获取集合大小
fruits.size();
遍历HashSet
// 迭代器遍历
Iterator<String> iterator = fruits.iterator();
while (iterator.hasNext()){
System.out.println(iterator.next());
}
// 增强for遍历
for (String fruit : fruits){
System.out.println(fruit);
}
// lambda 遍历
fruits.forEach(f->System.out.println(f));
求交集差集
HashSet<Integer> set1 = new HashSet<>(Arrays.asList(1,2,3,4,5,6));
HashSet<Integer> set2 = new HashSet<>(Arrays.asList(4,5,6,7,8,9));
// 求交集
boolean b = set1.retainAll(set2);
// 求差集
boolean b1 = set1.removeAll(set2);
转换为数组
String[] fruitsArray = fruits.toArray(new String[0]);
转换为其他集合类型
// 转换为其他集合类型
Set<String> set3 = new HashSet<>(List.of("a","b","c","a"));
ArrayList<String> arrayList = new ArrayList<>(set3);
LinkedList<String> linkedList = new LinkedList<>(set3);
比较两个HashSet
Set<String> set4 = new HashSet<>(Arrays.asList("a","b","c","d"));
Set<String> set5 = new HashSet<>(Arrays.asList("a","b","c","d"));
boolean isEquals = set4.equals(set5);
将自定义对象作为HashSet的元素,重写HashCode和equals
比如,有一个People类,将多个People对象传入到Set中,然后希望的结果是,只要idCard身份证号不同,就表示people不同,即名字相同并不是重复的元素。
People 类 (没有重写hashCode和equals方法):
package com.robin._collections;
public class People {
private String name;
private String sex;
private String idCard;
public String getName() {
return name;
}
public void setName(String name) {
this.name = name;
}
public String getSex() {
return sex;
}
public void setSex(String sex) {
this.sex = sex;
}
public String getIdCard() {
return idCard;
}
public void setIdCard(String idCard) {
this.idCard = idCard;
}
public People(String name, String sex, String idCard) {
this.name = name;
this.sex = sex;
this.idCard = idCard;
}
public People() {
}
@Override
public String toString() {
return "People{" +
"name='" + name + '\'' +
", sex='" + sex + '\'' +
", idCard='" + idCard + '\'' +
'}';
}
}
下面的代码中,HashSet并未对我们自定义的People类按照预期的方式去重,原因就是每个People对象的哈希值不同,所以HashSet认为每个对象都是不同的,但是实际情况并不是这样,这时候就需要我们重写hashCode和equals方法了。
Set<People> peopleSet = new HashSet<>();
People p1 = new People("张三","男","2001000");
People p2 = new People("王五","男","2001001");
People p3 = new People("李四","男","2001013");
People p4 = new People("李四","男","2001013");
People p5 = new People("李四","男","2001016");
peopleSet.add(p1);
peopleSet.add(p2);
peopleSet.add(p3);
peopleSet.add(p4);
peopleSet.add(p5);
peopleSet.forEach(people -> System.out.println(people));
重写hashCode和equals方法,我们只需要比较idCard这个字段即可,将下面的代码添加到People类中,然后再次测试HashSet的结果
@Override
public boolean equals(Object o) {
if (this == o) return true;
if (o == null || getClass() != o.getClass()) return false;
People people = (People) o;
return Objects.equals(idCard, people.idCard);
}
@Override
public int hashCode() {
return Objects.hash(idCard);
}
此时HashSet已经能够按照我们的想法去对自定义类型进行去重了。
小结
HashSet 的性能通常是很高的,它提供了快速的插入、删除和查询操作。
添加元素的性能:HashSet 的添加元素操作通常是很快的,但性能可能会随着负载因子的增加而下降。负载因子是一个衡量哈希表填充程度的参数,默认值是 0.75。当负载因子超过一定阈值时,HashSet 会进行扩容操作,这可能会导致性能下降。
查询元素的性能:HashSet 提供了快速的查询操作,因为它使用哈希表来存储元素,可以快速定位元素位置。
删除元素的性能:删除元素的性能通常也很高,与查询操作类似,可以快速定位要删除的元素。
HashSet 不允许添加重复元素,自动去重。
HashSet 不保证元素的顺序,元素在HashSet中是无序的。
当将自定义对象作为HashSet对象时,需要重写hashCode() 和 equals()方法,以保证对象在集合中的唯一性和正确性。