Java Sream中自定义Collector实现复杂数据收集方法

news2025/1/11 8:07:08
❃博主首页 : 「码到三十五」 ,同名公众号 :「码到三十五」,wx号 : 「liwu0213」
☠博主专栏 : <mysql高手> <elasticsearch高手> <源码解读> <java核心> <面试攻关>
♝博主的话 : 搬的每块砖,皆为峰峦之基;公众号搜索「码到三十五」关注这个爱发技术干货的coder,一起筑基

Java Stream API中的Collector接口是一个强大的工具,它允许我们自定义数据收集、转换和聚合的过程。

文章目录

      • 1. Collector接口的作用
      • 2. Collector接口的组成
      • 3. Collector接口的工作原理
      • 4. Collector的预定义实现Collectors
      • 5. 自定义Collector的使用场景

1. Collector接口的作用

Collector接口定义了数据收集、转换和聚合的基本操作,使得从Stream中收集到特定的数据结构或执行复杂的聚合操作成为可能。Collector接口为Stream操作提供了一个终止方法,将Stream的处理结果收集到一个特定的容器中。

2. Collector接口的组成

Collector接口包含以下五个主要方法:

  1. supplier():返回一个新的结果容器的Supplier。这个方法用于创建用于存储收集结果的容器。

  2. accumulator():接收一个结果容器和一个流中的元素,将元素添加到结果容器中。这是累积元素的核心方法,用于将流中的元素逐个添加到结果容器中。

  3. combiner():接收两个结果容器,合并它们。在并行流处理中,如果有多个结果容器被生成,则使用combiner()方法将它们合并为一个容器。

  4. finisher():接收一个结果容器,返回最终结果。这个方法通常用于将结果容器转换为最终想要的形式,例如,对容器中的元素进行排序或过滤。

  5. characteristics():返回一个不可变的Set,包含收集器的特性。这些特性用于优化流处理过程,如并行流处理或结果的无序性。

3. Collector接口的工作原理

Collector接口的工作原理基于上述五个方法的协作。先通过supplier()方法创建一个新的结果容器。然后,遍历Stream中的每个元素,使用accumulator()方法将元素添加到结果容器中。在并行流处理中,如果有多个结果容器被生成,则使用combiner()方法将它们合并为一个容器。最后,通过finisher()方法将结果容器转换为最终想要的形式,并返回。

4. Collector的预定义实现Collectors

Collectors可以看做是Collector接口的实现工厂,提供了多个用于数据收集、转换和聚合的预定义收集器,如toList()、toSet()、toMap()、joining()、counting()、summingInt()、averagingInt()等。这些收集器利用Collector接口实现,使得从Stream中收集数据变得更为方便和高效。

List<String> list = Stream.of("a", "b", "c")
.collect(Collectors.toList());

Map<Character, List<String>> grouped = Stream.of("a", "b", "c")
.collect(Collectors.groupingBy(s -> s.charAt(0)));

String joined = Stream.of("a", "b", "c")
.collect(Collectors.joining(", "));

如,toList()收集器通过调用new ArrayList<>()来创建一个新的结果容器,并使用accumulator()方法将流中的元素添加到结果容器中。toMap()收集器则创建一个新的HashMap,并使用提供的键函数和值函数将元素映射到Map的键和值上。

5. 自定义Collector的使用场景

通过实现Collector接口来自定义复杂的收集器,以满足特定的数据处理需求。自定义Collector时,要实现上述五个方法,并定义如何收集、转换和聚合数据。

如,自定义CollectorPerson对象进行排序,并根据特定条件进行分组:

public static class CustomCollector<T> implements Collector<Person, List<Person>, Map<String, List<Person>>> {
    @Override
    public Supplier<List<Person>> supplier() {
        return ArrayList::new;
    }

    @Override
    public BiConsumer<List<Person>, Person> accumulator() {
        return (list, person) -> list.add(person);
    }

    @Override
    public BinaryOperator<List<Person>> combiner() {
        return (list1, list2) -> {
            list1.addAll(list2);
            return list1;
        };
    }

    @Override
    public Function<List<Person>, Map<String, List<Person>>> finisher() {
        return list -> {
            Map<String, List<Person>> result = new HashMap<>();
            // 自定义排序规则
            list.sort((p1, p2) -> {
                if (p1.age != null && p2.age != null) {
                    return p1.age.compareTo(p2.age);
                } else if (p1.age != null) {
                    return -1;
                } else if (p2.age != null) {
                    return 1;
                } else {
                    return p1.name.compareTo(p2.name);
                }
            });

            // 自定义分组规则
            for (Person person : list) {
                if (result.containsKey(person.name.substring(0, 2))) {
                    result.get(person.name.substring(0, 2)).add(person);
                } else {
                    List<Person> group = new ArrayList<>();
                    group.add(person);
                    result.put(person.name.substring(0, 2), group);
                }
            }
            return result;
        };
    }

    @Override
    public Set<Collector.Characteristics> characteristics() {
        return EnumSet.of(Collector.Characteristics.IDENTITY_FINISH);
    }
}

自定义收集、转换和聚合Person对象的逻辑。使用自定义的排序和分组规则,根据姓名和年龄将Person对象分组并排序,最终返回Map<String, List<Person>>
通过自定义Collector,创建特定的收集器,而满足复杂的数据处理需求。

使用方法:

import java.util.*;
public class CustomCollectorDemo {
    public static void main(String[] args) {
        List<Person> people = Arrays.asList(
                new Person("Alice", 25),
                new Person("Bob", 23),
                new Person("Charlie", 28),
                new Person("David", 25),
                new Person("Eva", 23),
                new Person("Frank", 28)
        );
        Map<String, List<Person>> result = people.stream()
                .collect(new CustomCollector<>());
        System.out.println(result);
    }

    static class Person {
        String name;
        Integer age;
        ...
    }
}

关注公众号[码到三十五]获取更多技术干货 !

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2051545.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

雷达气象学(10)——双偏振雷达及其变量

文章目录 10.1 双偏振雷达的优势10.2 双偏振变量——反映降水粒子特性的变量10.3 差分反射率 Z D R Z_{DR} ZDR​10.3.1 差分反射率的定义10.3.2 雨滴的差分反射率10.3.3 冰、雪和冰雹的差分反射率10.3.4 层云降水的差分反射率10.3.5 对流降水的差分反射率 10.4 相关系数 ρ …

Chrome快捷键提高效率

浏览效率提高快捷建 快速切换标签页 Ctrl 数字&#xff08;1或者2&#xff09;&#xff0c;标签页数字从左到右为顺序&#xff0c;1开始。快速切换标签页。 Ctrl1 到 Ctrl8 切换到标签栏中指定位置编号所对应的标签页 Ctrl9切换到最后一个标签页 CtrlTab 或 CtrlPgDown 切…

Elasticsearch中磁盘水位线的深度解析

❃博主首页 &#xff1a; 「码到三十五」 &#xff0c;同名公众号 :「码到三十五」&#xff0c;wx号 : 「liwu0213」 ☠博主专栏 &#xff1a; <mysql高手> <elasticsearch高手> <源码解读> <java核心> <面试攻关> ♝博主的话 &#xff1a…

Clobbering DOM attributes to bypass HTML filters

目录 寻找注入点 代码分析 payload构造 注入结果 寻找注入点 DOM破坏肯定是出现在js文件中&#xff0c;我们首先来看源码 /resources/labheader/js/labHeader.js这个源码没什么问题我们重点关注在下面两个源码上 /resources/js/loadCommentsWithHtmlJanitor.js这个源码中重…

从关键新闻和最新技术看AI行业发展(第二十九期2024.7.29-8.11) |【WeThinkIn老实人报】

写在前面 【WeThinkIn老实人报】旨在整理&挖掘AI行业的关键新闻和最新技术&#xff0c;同时Rocky会对这些关键信息进行解读&#xff0c;力求让读者们能从容跟随AI科技潮流。也欢迎大家提出宝贵的优化建议&#xff0c;一起交流学习&#x1f4aa; 欢迎大家关注Rocky的公众号&…

docker 安装mino服务,启动报错: Fatal glibc error: CPU does not support x86-64-v2

背景 docker 安装mino服务&#xff0c;启动报错&#xff1a; Fatal glibc error: CPU does not support x86-64-v2 原因 Docker 镜像中的 glibc 版本要求 CPU 支持 x86-64-v2 指令集&#xff0c;而你的硬件不支持。 解决办法 降低minio对应的镜像版本 经过验证&#xff1a;qu…

sanic + webSocket:股票实时行情推送服务实现

&#x1f49d;&#x1f49d;&#x1f49d;欢迎莅临我的博客&#xff0c;很高兴能够在这里和您见面&#xff01;希望您在这里可以感受到一份轻松愉快的氛围&#xff0c;不仅可以获得有趣的内容和知识&#xff0c;也可以畅所欲言、分享您的想法和见解。 推荐&#xff1a;「storm…

Linux中的内核编程

Linux内核是操作系统的核心组件&#xff0c;负责管理系统的资源、提供硬件抽象和执行系统调用。内核编程是一项涉及操作系统核心的高级任务&#xff0c;它允许开发人员直接与系统内核进行交互&#xff0c;实现更高效、更特定的功能。本文将深入探讨Linux中的内核编程&#xff0…

2021年上半年网络工程师考试上午真题

2021年上半年网络工程师考试上午真题 网络工程师历年真题含答案与解析 第 1 题 以下关于RISC和CISC计算机的叙述中&#xff0c;正确的是&#xff08; &#xff09;。 (A) RISC不采用流水线技术&#xff0c;CISC采用流水线技术(B) RISC使用复杂的指令&#xff0c;CISC使用简…

事件驱动架构的事件版本管理

有一种办法&#xff1a;发送会议邀请给所有团队&#xff0c;经过101次会议后&#xff0c;发布维护横幅&#xff0c;所有人同时点击发布按钮。或... 可用适配器&#xff0c;但微调。没错&#xff01;就像软件开发中90%问题一样&#xff0c;有种模式帮助你找到聪明解决方案。 1…

C Primer Plus(中文版)第13章编程练习,仅供参考

第十三章编程练习 对于文件的操作是程序开发过程中必不可少的。首先&#xff0c;来看一下第一题&#xff0c;对13.1程序进行修改&#xff0c;输入文件名&#xff0c;而不是命令行参数。完整程序代码以及运行结果如下&#xff1a; #include<stdio.h> #include<stdlib…

【数据结构篇】~单链表(附源码)

【数据结构篇】~链表 链表前言链表的实现1.头文件2.源文件 链表前言 链表是一种物理存储结构上非连续、非顺序的存储结构&#xff0c;数据元素的逻辑顺序是通过链表中的指针链接次序实现的。 1、链式机构在逻辑上是连续的&#xff0c;在物理结构上不一定连续​ 2、结点一般是从…

Java二十三种设计模式-命令模式(18/23)

命令模式&#xff1a;将请求封装为对象的策略 概要 本文全面探讨了命令模式&#xff0c;从基础概念到实现细节&#xff0c;再到使用场景、优缺点分析&#xff0c;以及与其他设计模式的比较&#xff0c;并提供了最佳实践和替代方案&#xff0c;旨在帮助读者深入理解命令模式并…

【xr-frame】微信小程序xr-frame典型案例

微信小程序xr-frame典型案例 在之前的工作中&#xff0c;我大量使用XR-Frame框架进行AR开发&#xff0c;并积累了一些案例和业务代码。其中包括2D图像识别、手部动作识别、Gltf模型加载、动态模型加载、模型动画等内容。小程序部分使用TypeScript编写&#xff0c;而XR-Frame组…

利用puppeteer将html网页生成图片

1.什么是puppeteer&#xff1f; Puppeteer是一个Node库&#xff0c;它提供了一个高级API来通过DevTools协议控制Chromium或Chrome。 可以使用Puppeteer来自动化完成浏览器的操作&#xff0c;官方给出的一些使用场景如下&#xff1a; 生成页面PDF抓取 SPA&#xff08;单页应用…

3.Windows Login Unlocker-忘记电脑密码也可以解决

想要解锁Windows系统的开机密码&#xff0c;但官网的传统方法只适合Windows本地账户&#xff0c;对微软账户或PIN码()束手无策&#xff1f;别担心&#xff0c;小编之前推荐过的「Windows Login Unlocker」软件能为您排忧解难。这款出色的工具不仅能够轻松绕过各种Windows密码&a…

C语言-写一个用矩形法求定积分的通用函数,分别求积分区间为[0,1]sinx,cosx,e的x方的定积分

一、题目要求&#xff1a; 二、思路 ①数学方面:矩形法求定积分的公式 将积分图形划分成为指定数量的矩形&#xff0c;求取各个矩形的面积&#xff0c;然后最终进行累加得到结果 1.积分区间: [num1, num2] 2.分割数量:count 每个矩形的边长:dx(num2-num1)/count 3.被积分…

智慧草莓基地管理系统--论文pf

TOC springboot359智慧草莓基地管理系统--论文pf 绪论 1.1 研究背景 当前社会各行业领域竞争压力非常大&#xff0c;随着当前时代的信息化&#xff0c;科学化发展&#xff0c;让社会各行业领域都争相使用新的信息技术&#xff0c;对行业内的各种相关数据进行科学化&#xf…

泰安鲁菜根普照店重装开业:传承与创新并举 品味舌尖上的泰安

8月17日&#xff0c;泰安鲁菜根普照店重装开业。店内装修以泰山文化为主题&#xff0c;营造出一种浓郁的地方文化特色氛围。这家以泰山文化为底蕴&#xff0c;以大汶河传统民俗食材为基础的餐饮企业&#xff0c;一直致力于发掘和传承泰山周边及汶河两岸的传统特色美食&#xff…

【漫谈C语言和嵌入式009】探索LVDT:线性可变差动变压器的工作原理与应用

引言 在现代工业和工程领域中&#xff0c;精确的位移测量是许多系统正常运行的关键。线性可变差动变压器&#xff08;LVDT, Linear Variable Differential Transformer&#xff09;是一种广泛使用的位移传感器&#xff0c;因其高精度、可靠性和耐用性在各种应用中得到了普遍认可…