离散化 ---( 求区间和)

news2024/12/28 19:44:22

什么是离散化?

        离散化是将连续的数值范围映射到有限的、离散的数值集合的过程。在许多情况下,数据可能会存在多个重复值或范围较大的连续值。为了简化处理,尤其是处理区间查询和增量问题时,我们可以将这些值转换为一组有限的、唯一的值(即离散值),从而更高效地进行操作。

        例如,如果我们有一组数值 {1.1, 1.2, 1.15, 2.5},在离散化后,我们可能会将其映射为 {1, 2, 3} 这样的索引值,便于后续的操作。

为什么要学离散化?

  1. 降低时间复杂度:处理连续的数据可能导致算法的时间复杂度急剧增加。通过离散化,我们可以将问题转化为处理较小的离散集,从而大大提高算法的效率。

  2. 节省空间:在许多应用中,尤其是对于大规模数据,存储每个连续值可能占用大量的空间。离散化有助于减少需要存储的数据量,使得内存使用更加高效。

  3. 简化问题:离散化能够将复杂的问题分解为基础操作,比如通过离散化后的索引数组,可以更容易地实现前缀和、区间查询等常见算法。

  4. 易于去重和排序:在进行统计分析时,我们常常需要去除重复的数值或对数据进行排序。离散化可以降低重复数据的复杂度,使这些操作更为简单。

  5. 灵活应对动态数据:在处理增量更新和查询时,离散化提供了一种高效的方法来动态管理数据,从而能够实时响应用户的请求。 

问题描述

        假设我们有一系列的增量操作和询问操作。增量操作允许我们在某个点上增加一个值,而询问操作则用于查询某个区间内的总和。为了高效处理这些操作,我们需要进行离散化,避免处理大量的数字,转而处理相对较小的离散值。

 代码示例

 

import java.io.BufferedInputStream;
import java.util.ArrayList;
import java.util.Collections;
import java.util.List;
import java.util.Scanner;

/**
 * 区间和
 */
public class test1 {
    public static void main(String[] args) {
        Scanner sc = new Scanner(new BufferedInputStream(System.in));
        int n = sc.nextInt(); //n次操作
        int m = sc.nextInt(); //m次询问
        int N = 300010; //因为需要将所有x,l,r存在数组中,这样就是n + 2m <= 300000
        int[] a = new int[N]; //从1开始,需要通过x找到离散量,然后+1,
        int[] s = new int[N]; //前缀和来做,所以需要从1开始记录a

        List<Integer> alls = new ArrayList<>(); //将所有的使用到的数存在alls中,比如x,l,r
        //但其中会有先后顺序的差别,以及重复,所以需要排序和去重
        List<Pairs> add = new ArrayList<>(); //用来存n次操作
        List<Pairs> query = new ArrayList<>(); //用来存m次询问

        for (int i = 0; i < n; i++) {
            int x = sc.nextInt(); // 读取下一个增量数值
            int c = sc.nextInt(); // 读取增量值
            add.add(new Pairs(x, c)); // 将增量操作存储到add列表
            alls.add(x); // 将x值存储到alls,待后续处理
        }


        for (int i = 0; i < m; i++) {
            int l = sc.nextInt(); // 读取查询的左边界
            int r = sc.nextInt(); // 读取查询的右边界
            query.add(new Pairs(l, r)); // 存储查询操作到query列表
            alls.add(l); // 将左边界l加入alls
            alls.add(r); // 将右边界r加入alls
        }

        //到此为止,alls中存好了所有会被用到的数轴上的点,开始进行离散化处理

        Collections.sort(alls);//排序
        int unique = unique(alls);//去重
        alls = alls.subList(0, unique); //去重后的数值只保留有效部分

        for (Pairs item : add) {
            int index = find(item.first, alls); // 找到x在离散化数组中的位置
            a[index] += item.second; // 更新相应位置的增量值
        }


        //前缀和
        for (int i = 1; i <= alls.size(); i++) s[i] = s[i - 1] + a[i];

        for (Pairs item : query) {
            int l = find(item.first, alls); // 找到查询左边界的位置
            int r = find(item.second, alls); // 找到查询右边界的位置
            System.out.println(s[r] - s[l - 1]); // 输出区间和
        }

    }

    //去重
    static int unique(List<Integer> list) {
        int res = 0;
        for (int i = 0; i < list.size(); i++) {
            if (i == 0 || list.get(i) != list.get(i - 1)) {
                list.set(res, list.get(i));
                res++;
            }
        }
        return res;
    }

    //二分
    static int find(int x, List<Integer> list) {
        int l = 0;
        int r = list.size() - 1;
        while (l < r) {
            int mid = l + r >> 1;
            if (list.get(mid) >= x) {
                r = mid;
            } else {
                l = mid + 1;
            }
        }
        return l + 1; //因为要考虑到前缀和
    }
}

class Pairs {
    int first;
    int second;
    public Pairs(int first, int second) {
        this.first = first;
        this.second = second;
    }

}

 核心逻辑解释

1. 数据输入

        我们首先读取增量操作的次数 n 和询问操作的次数 m。然后,我们定义两个数组 a 和 s,其中 a 用于记录每个离散化值的增量,而 s 用于存储前缀和。

int n = sc.nextInt(); // n次操作
int m = sc.nextInt(); // m次询问
int[] a = new int[N]; // 存储离散化数值对应的增量
int[] s = new int[N]; // 存储前缀和

 2. 收集所有数值

        我们使用 alls 列表来收集所有在增量和询问过程中出现的数字,方便后续的离散化。将增量操作和查询操作中的数字放入 alls 中。

List<Integer> alls = new ArrayList<>();

3. 离散化处理

        对 alls 中的数字进行排序和去重,得到每个数字在离散化后对应的唯一索引。去重的实现通过 unique 方法完成,确保我们只保留有效的数字。

Collections.sort(alls); // 排序
int uniqueCount = unique(alls); // 去重
alls = alls.subList(0, uniqueCount); // 只保留有效部分

4. 更新增量

在确定了离散化对应的索引后,我们遍历 add 列表,更新对应的增量值到数组 a 中。

for (Pairs item : add) {
    int index = find(item.first, alls); // 找到离散化的索引
    a[index] += item.second; // 更新增量
}

5. 前缀和计算

我们接下来计算前缀和数组 s,以便能快速响应后续的查询请求。

for (int i = 1; i <= alls.size(); i++) 
    s[i] = s[i - 1] + a[i]; // 构建前缀和

6. 响应查询

        最后,我们通过 find 方法找到查询区间的左、右边界在离散化数组中的位置,然后利用前缀和快速计算区间和并输出结果。

for (Pairs item : query) {
    int l = find(item.first, alls); // 左边界
    int r = find(item.second, alls); // 右边界
    System.out.println(s[r] - s[l - 1]); // 输出区间和
}

总结

        用离散化的方式有效处理增量操作和区间查询问题。这种方法不仅减少了数据规模,还显著提升了查询效率,是解决类似问题时值得参考的思路。

        离散化在处理动态数据时,尤其是区间和、区间更新等问题中,具有非常广泛的应用,能够帮助我们更高效地完成各种统计任务。

        希望能为你提供一些启发,下面是代码的图片示例,这样看注释会更清楚一些……

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2168482.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【重学 MySQL】四十、SQL 语句执行过程

【重学 MySQL】四十、SQL 语句执行过程 select 语句的完整结构select 语句执行顺序SQL 语句执行原理 select 语句的完整结构 SELECT 语句是 SQL&#xff08;Structured Query Language&#xff09;中用于从数据库表中检索数据的核心语句。一个完整的 SELECT 语句结构可以包括多…

Linux系统部署Mysql8.x修改密码并且设置远程连接

配置yum仓库配置yum仓库 # 更新密钥 rpm import https:repo.mysql.com/RPM-GPG-KEY- mysql-2023 # 安装Mysql8.x版本 yum库 rpm -Uvh https:dev.mysql.com/get/mysql80-community-release-el7-2.noarch.rpm 由于MySQL并不在CentOS的官方仓库中&#xff0c;所以我们通过上述rp…

跟李沐学AI:自注意力和位置编码

自注意力 自注意力机制&#xff08;Self-Attention Mechanism&#xff09;&#xff0c;也被称为内部注意力&#xff08;Intra-attention&#xff09;或并行注意力&#xff08;Parallel Attention&#xff09;&#xff0c;是一种在深度学习模型中用于处理序列数据的机制。它允许…

新版pycharm如何导入自定义环境

我们新的版本的pycharm的ui更改了&#xff0c;但是我不会导入新的环境了 我们先点击右上角的add interpreter 然后点击添加本地编译器 先导入这个bat文件 再点击load 我们就可以选择我们需要的环境了

解决毕业论文难题!推荐7款AI自动生成论文工具网站

在当今学术研究和写作领域&#xff0c;AI论文写作工具的出现极大地提高了写作效率和质量。这些工具不仅能够帮助研究人员快速生成论文草稿&#xff0c;还能进行内容优化、查重和排版等操作。以下是七款值得推荐的AI自动生成论文工具网站&#xff0c;特别推荐千笔-AIPassPaper。…

arthas简单应用

背景说明 项目上某个接口响应时间过长&#xff0c;需要查看方法耗时情况进行优化 安装配置 访问下载页进行下载&#xff1a;下载 | arthas 调整文件位置进行解压缩 - 查看arthas帮助命令&#xff08;非必须&#xff0c;官网文档更详细&#xff09; C:\tools\arthas\4.0.1\b…

移动技术开发:HandlerAsyncTask

1 实验名称 Handler&AsyncTask 2 实验目的 掌握使用Handler消息传递机制和AsyncTask处理后台线程周期性的改变Activity中界面控件的属性 3 实验源代码 布局文件代码&#xff1a; &#xff08;1&#xff09;HandlerTest <?xml version"1.0" encoding&quo…

《深度学习》—— ResNet 残差神经网络

文章目录 一、什么是ResNet&#xff1f;二、残差结构&#xff08;Residual Structure&#xff09;三、Batch Normalization&#xff08;BN----批归一化&#xff09; 一、什么是ResNet&#xff1f; ResNet 网络是在 2015年 由微软实验室中的何凯明等几位大神提出&#xff0c;斩获…

文新智能体开发:省钱有道,智慧选择,属于你的“省钱小诸葛”

开发灵感 在开发购物类智能体“省购小诸葛”时&#xff0c;我的灵感源自于对现代消费者购物行为的深刻洞察与未来科技趋势的展望。想象一个时代&#xff0c;当信息的海洋变得浩瀚无垠&#xff0c;消费者在众多商品与促销活动中遨游&#xff0c;却往往感到迷茫与疲惫。这时&…

在CANoe/CANalyzer中Replay Block“一键发送”一个诊断/命令序列

案例背景&#xff1a; 在博文《在CANoeCANalyzer中“在线回放”CAN Log.asc/blf文件_canoe怎么回放blf文件-CSDN博客https://blog.csdn.net/qfmzhu/article/details/128954931》我们介绍了Replay Block模块的一些典型应用。 下面我们介绍如何使用Replay Block代替IG(Interact…

OJ在线评测系统 后端 使用代理模式编写测试类 并 实现核心业务判题流程

编写测试类(代理模式) 实现示例的代码沙箱 package com.dduo.dduoj.judge.codesandbox.impl;import com.dduo.dduoj.judge.codesandbox.CodeSandbox; import com.dduo.dduoj.judge.codesandbox.model.ExecuteCodeRequest; import com.dduo.dduoj.judge.codesandbox.model.Exec…

Linux 冯诺依曼体系结构与操作系统概念

目录 0.前言 1. 冯诺依曼体系结构概述 1.1 输入单元 1.2 中央处理单元&#xff08;CPU&#xff09; 1.3 输出单元 2. 冯诺依曼体系结构的关键特性 2.1 所有数据流向内存 2.2 数据流动示例&#xff1a;QQ聊天过程 3. 操作系统 3.1 概念 3.2 设计操作系统的目的 3.3 操作系统的“…

华为源NAT技术与目的NAT技术

1&#xff09;源NAT对报文源地址进行转换&#xff0c;分为NAT NO-PAT&#xff0c;NAPT,EASY-IP,三元组NAT&#xff1b; &#xff08;1&#xff09;NAT NO-PAT原理&#xff1a; no-port address translation:非端口地址转换&#xff1a;只转换地址&#xff0c;不转换端口&…

【C++位图】构建灵活的空间效率工具

目录 位图位图的基本概念如何用位图表示数据位图的基本操作setresettest 封装位图的设计 总结 在计算机科学中&#xff0c;位图&#xff08;Bitmap&#xff09;是一种高效的空间管理数据结构&#xff0c;广泛应用于各种场景&#xff0c;如集合操作、图像处理和资源管理。与传统…

使用docker形式部署prometheus+alertmanager+钉钉告警

一、拉取所需要的镜像 docker pull prom/node-exporter docker pull grafana/grafana docker pull prom/prometheus docker pull prom/alertmanager 其中 prom/node-exporter&#xff1a;用于收集主机系统信息和指标的 grafana/grafana&#xff1a;是一个用于可视化和分…

word2vector理论

目录 1.理论 2.公式 3.SkipGram的优化 1.理论 2.公式 3.SkipGram的优化 CBOW的优化, CBOW是用上下文预测中心词. Hirarchical softmax帮助我们最快的找到最大的softmax, 通过建立一个霍夫曼树.

【数据结构】AVL树相关知识详细梳理

1. AVL树的概念 AVL的全称是Adelson-Velsky-Landis&#xff0c;其名称来源于其发明者Adelson、Velsky和Landis&#xff0c; 是平衡二叉树搜索树。 它的出现是由于二叉搜索树虽可以缩短查找的效率&#xff0c;但如果数据有序或接近有序二叉搜索树将退化为单支树&#xff0c;查找…

城市轨道交通网络客流大数据可视化分析系统----以某市交通网络客流数据为例

1 引言 1.1研究背景、目的与意义 1.1.1研究背景 城市轨道交通系统是现代城市的重要交通方式之一&#xff0c;随着城市化进程的加速和人口增长&#xff0c;轨道交通系统的客流量不断增加。因此&#xff0c;轨道交通部门和相关企业需要对客流数据进行实时监测和分析&#xff0…

云数据库RDS MySQL性能测试与对比@2024年09月

原创&#xff1a;orczhouninedata 来源&#xff1a;云数据库技术 在不同的云厂商购买相同规格的MySQL实例(如4vCPU-16GB)&#xff0c;获得的性能相同吗&#xff0c;他们的差异如何&#xff1f;本文继续尝试回答这个问题。 详细数据&#xff1a; 测试结果概述 在本次测试中&…

常见的TTL,RS232,RS485,IIC,SPI,UART之间的联系和区别

简单总结 图片来源 RS232,RS485可参考&#xff0c;IIC&#xff0c;SPI,UART可参考 烧录程序中常听到的一句话就是USB转TTL&#xff0c;但严格来说算是USB传输数据的协议转换成TTL&#xff08;Transistor-Transistor Logic&#xff09;协议传输数据。首先&#xff0c;usb是常见…