深入理解树状数组

news2024/11/26 16:59:16

大家好,我是 方圆。关于各类区间和问题有很多种解法,我们可以根据题目要求选择解题的方向:

  • 数组不变,区间查询:前缀和、树状数组和线段树

  • 数组单点查询,区间查询:树状数组 和线段树

  • 数组区间修改,单点查询:差分 和线段树

  • 数组区间修改,区间查询:线段树

树状数组是其中能解决问题最多的,而且它相比于线段树代码量更少更简单,是我们 优先选择的方法。在本文我们对线段树进行介绍,并在文末附上相关的习题供大家练习。如果大家想要找刷题路线的话,可以参考 Github: LeetCode。

树状数组

树状数组(BIT, Binary Indexed Tree)是简洁优美的数据结构,它能在很少的代码量下支持 单点修改区间查询,我们先以 a[] {1, 2, 3, 4, 5, 6} 数组为例建立树状数组看一下树状数组的样子:

在这里插入图片描述

可以发现:不是所有节点都是连接在一起的,c[1], c[2], c[3], c[4] 和 c[5], c[6] 分别构成了两棵树;奇数索引位置的节点只管辖一个数组元素(我们例子中以 1 为起始索引)。那么这个树状数组是怎么计算和推导出来的呢?

管辖的区间

树状数组的每个元素会管辖多少个数组元素?也就是说每个元素的区间长度是多少?我们从上图中已经知道了奇数的树状数组元素只管辖一个元素,区间为 c[x] = [x, x],那么我们只需再研究下偶数元素管辖的区间长度即可。

  • c[y] 所管辖的区间长度为 2k ,其中 k 为 y 的 2 进制表示中最低位 1 后面所有 0 的数量;c[y] 所管辖的区间为:[y - 2k + 1, y]

我们以 c[4] 为例,它管辖多少个元素呢?4 的 2 进制表示为 0100,最低位 1 后面 0 的数量为 2,即 k = 2,那么 2k = 22 = 4,所以它管辖的区间长度为 4,也就是 4 个数组元素,区间为 [4 - 4 + 1, 4] = [1, 4]。

父节点是谁?

现在我们知道每个元素所管辖的区间范围了,那么我们怎么才能知道它的父节点是谁呢?就比如说我们现在得到了 c[1] 元素,我们想知道它的父节点,要怎么计算呢?

  • c[x] 的父节点为 c[x + lowbit(x)]

怎么回事?其中的 lowbit(x) 是什么东西?其实它的值和 2k 一致,其中 k 为 x 的 2 进制表示中最低位 1 后面所有 0 的数量,熟悉不熟悉?这个 lowbit(x) 和我们上文中计算该元素所管辖区间长度的值一致!这不就简单了!

  • lowbit(x) 的计算方法:lowbit(x) = x & -x

    我们以计算 c[2] 为例,lowbit(2) = 2 & -2,其中 2 的 2 进制表示为 0010,-2 的 2 进行表示为 1110,它的计算方法为将 2 的所有非符号位二进制全部取反后再加 1,即 1101 + 1 = 1110,执行 & 运算后结果为 0010,十进制表示为 2,与 21 值一致。lowbit 的计算用代码表示为:

        int lowbit(int x) {
            return x & -x;
        }
    

我们以 c[1] 节点为例计算下它的父节点是谁,lowbit(1) = 1 & -1 = 0001 & 1111 = 0001 = 1,那么它的父节点为 c[1 + 1] = c[2],与图上表示的一致。


现在我们已经知道如何通过计算来创建树状数组了, 接下来我们要看下它的应用。

区间查询

区间查询我们先讨论计算前 N 项和的方法,比如我们现在要查询前 6 项和,我们来看下它查询的过程:

  • 从 c[6] 开始找子节点,有 c[6] 管辖的区间为 [5, 6],那么再往下找需要找 c[4],它的区间为 [1, 4],计算这两个节点的和即可。

那么从 c[6] 跳到 c[4] 是如何计算出来的呢?我们可以通过 c[6] 区间的下界减 1 来得到,转换成公式表示即为 x - lowbit(x) = 6 - 2 = 4,当它跳到 c[4] 时发现已经满足求和条件,不再向下跳而结束查找,而且我们可以通过计算 4 - lowbit(4) = 4 - 4 = 0 ,可以发现当 x - lowbit(x) = 0 时为结束查找的条件。我们用代码来表示为:

    int query(int x) {
        int res = 0;
        for (int i = x; i > 0; i -= lowbit(i)) {
            res += c[i];
        }
        
        return res;
    }

那么我们计算区间 [3, 6] 的和该如何计算呢?我们从图中可以发现,先计算出[1, 6] 和 [1, 2] 的和,再使用前者减去后者即为所得,用代码表示为:

    int query(int left, int right) {
        return query(right) - query(left - 1);
    }

单点修改

如果我们要修改 a[x] 的值,我们仅需要修改所有管辖了 a[x] 的 c[y] 即可,而 a[x] 可能会被多个 c[y] 管辖,这些所有的 c[y] 节点该如何确定呢?我们可以回头再去看看前面的树状数组配图,比如我们要修改 a[1] 的值,那么我们需要修改 c[1], c[2] 和 c[4] ,能不能发现它是在不断的 跳父节点 修改?所以,如果我们要修改数组中某个元素的值,树状数组的更新则是不断地更新父节点值。好,我们直接上代码吧:

    // 将 index 索引处的值更新为 num
    void update(int index, int num) {
        a[index] = num;
        add(index, num - a[index]);
    }

    // 更新 c[index] 的值,变化差值为 val
    void add(int index, int val) {
        for (int i = index; i <= c.length; i += lowbit(i)) {
            c[i] += val;
        }
    }

建树

好了,区间查询和单点修改我们都讲完了,但是从头到尾我们还没说过树状数组是怎么建立的呢。我们可以想一下,c 数组初始化时每个索引处的值都为 0,建树仅需要将 a 数组中所有值都在树状数组中执行单点修改即可:

    public BinaryIndexedTree(int[] a) {
        this.a = a;
        this.c = new int[a.length + 1];
        
        for (int i = 0; i < a.length; i++) {
            add(i + 1, a[i]);
        }
    }

到这里我们基本上已经将树状数组讲解完毕了,它的全量代码如下:

public class BinaryIndexedTree {

    int[] a;

    int[] c;

    public BinaryIndexedTree(int[] a) {
        this.a = a;
        this.c = new int[a.length + 1];

        for (int i = 0; i < a.length; i++) {
            add(i + 1, a[i]);
        }
    }

    // 将 index 索引处的值更新为 num
    void update(int index, int num) {
        a[index] = num;
        add(index, num - a[index]);
    }

    // 更新 c[index] 的值,变化差值为 val
    void add(int index, int val) {
        for (int i = index; i < c.length; i += lowbit(i)) {
            c[i] += val;
        }
    }

    int query(int left, int right) {
        return query(right) - query(left - 1);
    }

    // 查询前缀和的方法
    int query(int x) {
        int res = 0;
        for (int i = x; i > 0; i -= lowbit(i)) {
            res += c[i];
        }

        return res;
    }

    int lowbit(int x) {
        return x & -x;
    }
}

我们需要掌握或背过这个模板,并不断的做题练习。

相关题目

  • 307. 区域和检索 - 数组可修改

本题是最典型的树状数组的应用,涉及单点修改和区间查询,使用线段树修改对应索引位置的数即可。

  • 1310. 子数组异或查询

本题是求区间和线段树的变体,它求的是区间异或结果,异或运算的特点是二进制位相同的异或计算结果为 0,不同的异或计算结果为 1,我们可以根据这个特点计算进行区间异或计算,比如说我们要查询区间 [3, 5] 的异或结果,那么可以使用 [1, 5] 区间结果异或 [1, 2] 区间结果,相当于在区间 [1, 5] 中去掉了 [1, 2]。

  • 775. 全局倒置与局部倒置

本题是对上述使用线段树的变体,前两道题中的线段树记录的是所有数组中的元素值,而本题的线段树记录的是数组中各个元素出现的次数,而且题目要求所有数字不同,这体现在线段树中就是出现过的数字被标记为 1,未出现过的数字被标记为 0。全局倒置和局部倒置相当于是计算逆序对的数量,全局倒置是在线段树中查询区间 (x, n] 中出现数字的数量(x 为当前数),局部倒置更加简单,判断当前数是否比前一个数小即可。

  • 1395. 统计作战单位数

本题和上一题类似,也是标记数值出现的次数,但是解法可能没办法一下就想到。我们每次标记士兵 i 和士兵 k,当 rating[i] < rating[k] 时统计区间 (i, k) 内士兵 j 的数量,当 rating[i] > rating[k] 时查询区间 (k, i) 内士兵 j 的数量,并且每次统计完成后需要将线段树标记清零,避免造成不符合题意的统计结果,时间复杂度为 O(n2logm)。

  • 327. 区间和的个数

说实话,这道题我第一次看答案都没写出来。现在我们从头捋一下,一步步地把题解写出来。根据题目中提到子数组 区间和,且不涉及区间的修改,我们能够想到使用前缀和的方法来求解,根据 前缀和作差能够计算出任意区间和 的特点,我们再进一步考虑如何实现。

我们记前 i 项的前缀和为 s,s = sum[0, i],其中 0 <= i <= nums.length - 1,其中必然存在某区间满足题意要求,我们记 s = sum[0, k] + sum[k + 1, i],其中 k < i,若 sum[k + 1, i] 符合题意要求,则有:

在这里插入图片描述

那么我们可以根据以上结果得出,任意区间 [0, i] 内符合题意的数量等于该区间内前缀和满足 [s - upper, s - lower] 条件的数量(i 为我们当前处理的索引位置,s 为当前 i 项前缀和,k 为已经处理过的索引位置),这样我们能够使用树状数组标记前缀和的值(sum[0, k]),并计算区间内值的数量得出结果。但是由于数组中每个数范围很大,会导致值域爆炸,所以需要采用离散化的方法,这样才能在树状数组中对值进行标记。

离散化是指当我们只关心数据的大小关系时,用排名代替原数据进行处理的一种预处理方法。离散化本质上是一种哈希,它在保持原序列大小关系的前提下把其映射成正整数。当原数据很大或含有负数、小数时,难以表示为数组下标,导致一些算法和数据结构(如BIT)无法运作,这时我们就可以考虑将其离散化。

好了,基本思路已经确定了,我们看下具体代码实现,关注其中的注释即可:

    public int countRangeSum(int[] nums, int lower, int upper) {
        // 使用 set 记录下所有的前缀和前缀和需要满足的题意范围的值,供我们做离散化使用
        // 之所以使用 set 是因为我们只需要知道它在树状数组中的位置,而不要求它的数量
        Set<Long> set = new HashSet<>();
        long preSum = 0L;
        // 需要将前缀和 0 也标记进来,它是原数组索引 0 处值的前缀和
        set.add(preSum);
        for (int j : nums) {
            preSum += j;

            set.add(preSum);
            set.add(preSum - upper);
            set.add(preSum - lower);
        }
        // 所有的值都有了,我们进行离散化处理
        ArrayList<Long> list = new ArrayList<>(set);
        Collections.sort(list);
        // 使用 hashmap 来保存值对应在树状数组的索引
        HashMap<Long, Integer> map = new HashMap<>();
        for (int i = 0; i < list.size(); i++) {
            map.put(list.get(i), i + 1);
        }

        int res = 0;
        BinaryIndexedTree tree = new BinaryIndexedTree();
        // 前缀和从 0 开始计算
        preSum = 0L;
        // 标记数组索引 0 前的前缀和在树状数组中的位置
        tree.update(map.get(0L));

        for (int num : nums) {
            preSum += num;

            int left = map.get(preSum - upper);
            int right = map.get(preSum - lower);
            res += tree.query(left, right);

            // 更新该前缀和在树状数组中的位置
            tree.update(map.get(preSum));
        }

        return res;
    }

    static class BinaryIndexedTree {

        int[] tree;

        public BinaryIndexedTree() {
            // 数组长度为 1e5 我们需要把对应的范围值也保存上,所以需要 * 3
            tree = new int[(int) 3e5 + 1];
        }

        public void update(int index) {
            for (int i = index; i < tree.length; i += lowbit(i)) {
                tree[i] += 1;
            }
        }

        public int query(int left, int right) {
            return query(right) - query(left - 1);
        }

        public int query(int index) {
            int res = 0;
            for (int i = index; i > 0; i -= lowbit(i)) {
                res += tree[i];
            }

            return res;
        }

        private int lowbit(int i) {
            return i & -i;
        }
    }

巨人的肩膀

  • 树状数组(简单介绍)

  • 负数的二进制表示方法(正数:原码、负数:补码)

  • 树状数组

  • 算法学习笔记(2) : 树状数组

  • 维基百科 - 树状数组

  • 关于各类「区间和」问题如何选择解决方案(含模板)

  • 算法学习笔记(19): 离散化

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/938710.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

“业务敏捷的领导力” 工作坊 · 2023年9月3日

“业务敏捷的领导力”在线工作坊 2023年9月3日&#xff1b;9:30-11:30 am 授课工具&#xff1a;Zoom分组Miro画布互动练习 讲师&#xff1a;Jim Wang王军 报名条件 优先捷行学员免费参加&#xff0c;报名2023后半年课程的学员免费&#xff0c;工作坊限定30人&#xff0…

【附安装包】Fireworks CS6安装教程

软件下载 软件&#xff1a;Fireworks版本&#xff1a;CS6语言&#xff1a;简体中文大小&#xff1a;165.87M安装环境&#xff1a;Win11/Win10/Win8/Win7硬件要求&#xff1a;CPU2.0GHz 内存4G(或更高&#xff09;下载通道①百度网盘丨下载链接&#xff1a;https://pan.baidu.c…

STM32启动模式详解

文章目录 前置知识1. 单片机最小系统组成2. BOOT电路3. 三种启动模式4. 存储器映射 从主FLASH启动从系统存储区启动从SRAM启动 前置知识 1. 单片机最小系统组成 一个单片机最小系统由电源、晶振、下载电路、BOOT电路、和复位电路组成。少一个单片机都启动不了。 2. BOOT电路 …

华为云Stack的学习(二)

三、华为云Stack产品组件 FunsionSphere CPS 提供云平台的基础管理和业务资源&#xff08;包括计算资源和存储资源&#xff09;。采用物理服务器方式部署在管理节点。可以做集群的配置&#xff0c;扩容和运维管理。 Service OM 提供云服务的运维能力&#xff0c;采用虚拟化方…

线程基础:Java多线程的创建休眠与等待

目录 一.Thread 类是什么? 二.Thread 类的几个常见属性 三.线程创建 1. 继承Thread&#xff0c;重写 run 方法 2. 实现Runnable&#xff0c;重写 run 方法 3. 继承Thread&#xff0c;使用匿名内部类 4. 实现Runnable&#xff0c;使用匿名内部类 5. 使用 lambda 表达式…

大数据-玩转数据-Flink窗口

一、Flink 窗口 理解 在流处理应用中&#xff0c;数据是连续不断的&#xff0c;因此我们不可能等到所有数据都到了才开始处理。当然我们可以每来一个消息就处理一次&#xff0c;但是有时我们需要做一些聚合类的处理&#xff0c;例如&#xff1a;在过去的1分钟内有多少用户点击…

医疗器械行业的MES系统解决方案

医疗器械行业的MES系统&#xff08;制造执行系统&#xff09;解决方案是为医疗器械制造企业提供的一种集成化的信息技术系统&#xff0c;用于管理和监控制造过程&#xff0c;提高生产效率&#xff0c;确保产品质量&#xff0c;以及优化整个生产流程。MES系统通常涵盖了生产计划…

No118.精选前端面试题,享受每天的挑战和学习

文章目录 为什么说HTTP是无状态的协议&#xff1f;HTTP 报文结构是怎样的&#xff1f;HTTP1.1 中如何解决 HTTP 的队头阻塞问题&#xff1f;HTTP 中如何处理表单数据的提交&#xff1f;说下application/x-www-form-urlencoded 和 multipart/form-data对于定长和不定长的数据&am…

影视公司技术流程设计之Pipeline数据管理

使用场景 1 设计师画好设计稿后怎样让导演审查&#xff1f; 叫到位子上看&#xff1f; 放个文件夹会议室统一看&#xff1f;意见怎么记录&#xff0c;怎么反馈&#xff1f; 2 材质&#xff0c;绑定文件怎么与模型同步&#xff0c; 很多时间是绑定不小心改了&#xff0c; 去了灯…

WinRAR<6.23 远程代码执行漏洞【Poc公开】(CVE-2023-38831) [有POC]

漏洞类型代码注入发现时间2023-08-25漏洞等级高危MPS编号MPS-bw2s-d0rvCVE编号CVE-2023-38831漏洞影响广度广 漏洞危害 OSCS 描述WinRAR 是一款适用于 Windows 系统的压缩包管理器。 WinRAR 6.2.3之前版本打开压缩文件时会调用 ShellExecute 函数匹配文件名&#xff0c;如果目…

软件设计师(十一)标准化和软件知识产权基本知识

一、标准化基础知识 标准(Standard)是对重复性事物和概念所做的统一规定 标准化工作的特征包括横向综合性、政策性和统一性 1、基本概念 &#xff08;1&#xff09;标准的分类 国际标准&#xff1a;ISO、IEC等国际标准化组织国家标准&#xff1a;GB一中国、ANSI一美国、BS一…

AIGC领航,智能AI赋能乡村教育,梦想扬帆远航

一位扎根深山支教十年的湖北教师袁辉的故事曾经感受无数人&#xff0c;新华社、人民日报都撰文为他点赞。在他带过的学生中&#xff0c;有一位名叫青青的女学生患有成骨不全症&#xff0c;俗称“瓷娃娃”&#xff0c;学校离家十几公里山路&#xff0c;上学对她来说&#xff0c;…

Java注解与反射

&#x1f497;wei_shuo的个人主页 &#x1f4ab;wei_shuo的学习社区 &#x1f310;Hello World &#xff01; Java注解与反射 Java注解和反射是Java语言中两个强大的特性&#xff0c;它们可以一起使用以实现动态的、灵活的编程和元数据处理 注解 Java注解&#xff08;Annotatio…

振弦采集读数模块开发原理详细介绍

飞讯教学篇&#xff1a;振弦采集读数模块开发原理详细介绍 振弦采集读数模块是一种用于采集弦振信息的模块&#xff0c;其原理是通过传感器感知弦的振动&#xff0c;将其转化为电信号&#xff0c;然后经过模拟处理和数字化处理&#xff0c;最终输出为可供后续处理的数字信号。…

Python照片压缩教程:如何轻松减小图片大小

介绍 在日常的编程工作中&#xff0c;我们经常需要处理图像&#xff0c;例如上传、下载、显示、编辑等。有时候&#xff0c;我们需要对图像进行压缩&#xff0c;以减少占用的空间和带宽&#xff0c;提高加载速度和用户体验。那么&#xff0c;如何用Python来实现图像压缩呢&…

【数据分析】统计量

1. 均值、众数描述数据的集中趋势度量&#xff0c;四分位差、极差描述数据的离散程度。 2. 标准差、四分位差、异众比率度量离散程度&#xff0c;协方差是度量相关性。 期望值分别为E[X]与E[Y]的两个实随机变量X与Y之间的协方差Cov(X,Y)定义为&#xff1a; 从直观上来看&…

开源vue动态表单组件

一、项目简介 vueelement的动态表单组件&#xff0c;拖拽组件到面板即可实现一个表单 二、实现功能 支持拖拽 支持输入框 支持文本框 支持数字输入框 支持下拉选择器 支持多选框 支持日期控件 支持开关 支持动态表格 支持上传图片 支持上传文件 支持标签 支持ht…

无涯教程-Python机器学习 - Semi-supervised Learning函数

Python机器学习 中的 Semi - 无涯教程网无涯教程网提供https://www.learnfk.com/python-machine-learning/machine-learning-with-python-semi-supervised-learning.html

图像翻拍检测——反射分量分离的特征融合

随着计算机技术的迅速发展&#xff0c;需要建立人与信息一一对应的安保认证技术&#xff0c;通过建立完整的映射网络体系&#xff0c;从而确保每个人的人身、财产、隐私等的安全.与指纹、基因等人体生物特征识别系统相比&#xff0c;人脸识别系统更加友好&#xff0c;不需要人的…

【C语言】位操作符的一些题目与技巧

初学者在学完位操作符之后&#xff0c;总是不能很好的掌握&#xff0c;因此这篇文章旨在巩固对位操作符的理解与使用。 有的题目可能会比较难以接受&#xff0c;但是看完一定会有收获 目录 位操作符&#xff1a;一些题目&#xff1a;不创建临时变量交换整数整数转换二进制中1的…