LeetCode - 1371 每个元音包含偶数次的最长子字符串(Java JS Python C)

news2024/9/29 23:28:55

题目来源

1371. 每个元音包含偶数次的最长子字符串 - 力扣(LeetCode)

题目描述

给你一个字符串 s ,请你返回满足以下条件的最长子字符串的长度:每个元音字母,即 'a','e','i','o','u' ,在子字符串中都恰好出现了偶数次。

示例

示例 1

输入:s = "eleetminicoworoep"
输出:13
解释:最长子字符串是 "leetminicowor" ,它包含 e,i,o 各 2 个,以及 0 个 a,u 。


示例 2

输入:s = "leetcodeisgreat"
输出:5
解释:最长子字符串是 "leetc" ,其中包含 2 个 e 。


示例 3

输入:s = "bcbcbc"
输出:6
解释:这个示例中,字符串 "bcbcbc" 本身就是最长的,因为所有的元音 a,e,i,o,u 都出现了 0 次。

提示

  • 1 <= s.length <= 5 x 10^5
  • s 只包含小写英文字母。

题目解析

本题最简单的思路就是双循环暴力枚举所有子串,然后计算子串内各个元音的数目。

但是这种思路肯定会超时。

我们枚举子串的目的,是为了统计子串中各元音字符的数量,而实现该需求的更优思路是利用前缀和。

前缀和的应用场景有非常鲜明的特点,如求解连续范围内的状态,实际例子有:求解任意区间的和。

本题其实也可以当成前缀和问题来看,我们遍历输入串,每遍历一个字符,则对应位置 i 就有一个前缀状态 preSum[i],本题preSum[i] 表示 [0, i] 范围内各个元音字符的数量,具体表现为:

preSum[i] = {
    ‘a’:aCount,

    'e':eCount,

    'i':iCount,

    'o':oCount,

    'u':uCount
}

那么,如果我们要求解范围[i, j]子串的各个元音的数量,即可通过 preSum[j] - preSum[i-1] 得到。
更多前缀和知识请看:算法设计 - 前缀和 & 差分数列_算法设计 - 前缀和 & 差分数列_伏城之外的博客-csdn博客-CSDN博客

但是光靠前缀和,我们还是要枚举所有子串,依旧会超时。

本题要求我们求解最长的子串,子串范围内各个元音数量为偶数。我们假设:

preSum[j] 位置各个元音的数量分别为:aCount偶数,eCount奇数,iCount偶数,oCount偶数,uCount奇数

再假设 [i, j] 范围内各个元音的数量都为偶数,那么此时preSum[i-1]的各个元音的数量应该是多少呢?

答:必然和preSum[j] 对应元音的数量同奇偶性。因为:

  • 奇数 - 奇数 = 偶数
  • 偶数 - 偶数 = 偶数

比如 preSum[j] = {aCount: 8,  eCount: 3, iCount: 6, oCount: 4, uCount: 5};

且  preSum[i-1] = {aCount: 2,  eCount: 1, iCount: 4, oCount: 2, uCount: 3};

那么 [i, j] 范围内,各个元音的数量为:

  • aCount = 8 - 2 = 6
  • eCount = 3 - 1 = 2
  • iCount = 6 - 4 = 2
  • oCount = 4 - 2 = 2
  • uCount = 5 - 3 = 2

因此,当我们得到 preSum[j] 后,我们应该在 i - 1 ∈ [0, j - 1] 范围内找到一个 preSum[i-1] 和 preSum[j] 的各个元音同奇偶性的,且 i - 1要最小,这样得到 [i, j] 范围子串才是 [0, j] 范围内一个最长的且各个元音数量都为偶数的子串。

此时,逻辑虽然得到了优化,但是我们依旧要遍历 0 ~ j - 1 范围内的位置 i,且需要对比对应 preSum[i] 和 preSum[j] 的各个元音的奇偶性,这样依然会超时。

接下来要用到状态压缩了。

由于我们只关注各个元音的数量的奇偶性,即每个元音的数量要么为奇数,要么为偶数,假设我们用0表示偶数,用1表示奇数的话。

那么初始 preSum[0] 的各个元音的状态就可以表示为二进制数:00000

各个二进制位和对应元音对应,如上图所示,当二进制位值为0时,表示对应元音数量为偶数个,当二进制位值为1时,表示对应元音数量为奇数个。

这样我们就完成了 preSum[i] 的状态压缩。

那么状态压缩后的preSum[j] 和 preSum[j+1] 如何进行前缀和累进呢?

假设 j+1 位置的字符是 'e',那么代表,preSum[j] 的二进制数 中 'e' 对应的位的性质反转,即奇变偶,偶变奇。

比如 preSum[j] = 01010,而 s[j+1] 字符是 'e',则 preSum[j+1] = 00010

此时我们完全可以用异或运算从preSum[j]得出preSum[j+1]的结果,比如 s[j+1] == 'e',则

preSum[j + 1] = preSum[j] ^ 01000

其中 01000 代表是新增一个'e'字符,同理

  • 10000 代表新增一个 'a' 字符
  • 01000 代表新增一个 'e' 字符
  • 00100 代表新增一个 'i' 字符
  • 00010 代表新增一个 'o' 字符
  • 00001 代表新增一个 'u' 字符

接下来就是,比较preSum[i] 和 preSum[j] 的各个元音的奇偶性是否一致,就可以直接将对应二进制数进行值比较即可,值相同,则奇偶性一致,否则不一致。

比如:preSum[i-1] = 01010,preSum[j] = 01010,那么二者的各个元音的奇偶性就一致。

当我们完成preSum[i]的状态压缩后,我们就可以定义一个哈希表map来记录某个压缩状态最早出现的位置,map的key时压缩状态,val时该压缩状态的最早出现位置。

即:我们求解[0, j]范围前缀子串的压缩状态status = preSum[j]后:

  • 如果map存在key=status,那么status状态最早出现位置为 map[staus],我们定义 i = map[status],那么i,j位置的前缀子串内部的各个元音的数量是同奇偶性的,即 [i+1, j] 范围内子串的各个元音的数量B必然都是偶数,[i+1, j] 范围子串是一个符合要求的子串,我们需要记录该子串的长度 j - (i + 1) + 1 = j - i
  • 如果 map 不存在 key == status,那么status状态最早出现的位置就是 j,我们需要记录 map[status] = j

按照逻辑,我们只要遍历一遍字符串s,即可找到最长的目标子串。

JS算法源码

/**
 * @param {string} s
 * @return {number}
 */
var findTheLongestSubstring = function (s) {
  // "前缀子串"中各个元音的奇偶状态
  // 00000
  // aeiou
  // 元音字母和二进制位的对应关系如上,如果二进制位值位0,代表对应元音字符数量有偶数个,如果二进制位值为1,代表对应元音字符数量有奇数个
  // 初始未遍历时,没有子串,此时各个元音的数量都为0,即偶数个,因此所有二进制位值位0
  let status = 0b00000;

  // map记录某个状态的最早出现位置
  // 压缩状态用五位二进制数表示,因此最多有32种状态
  const map = new Array(32).fill(-2); // -2是一个不可能的位置,即初始时所有状态都未出现过
  // 00000 状态对应的十进制数为0,最早出现位置是-1,即未遍历,没有子串时
  map[0] = -1;

  // 记录最长的符合要求的子串长度
  let maxLen = 0;

  for (let i = 0; i < s.length; i++) {
    // 如果遍历的字符s[i]是元音字母,则变更对应二进制位的奇偶性
    switch (s[i]) {
      case "a":
        status ^= 0b10000;
        break;
      case "e":
        status ^= 0b01000;
        break;
      case "i":
        status ^= 0b00100;
        break;
      case "o":
        status ^= 0b00010;
        break;
      case "u":
        status ^= 0b00001;
        break;
    }

    // 如果对应状态的最早出现位置为-2,表示没有出现过对应状态,否则map[status]即status状态最早出现的位置
    if (map[status] != -2) {
      // 当前位置 i 的状态为status,而最早出现status状态的位置是 map[status],两个位置同奇偶性,因此他们形成的范围内子串是符合要求的
      maxLen = Math.max(maxLen, i - map[status]);
    } else {
      // 如果对应状态之前未出现过,则当前位置 i 就是该状态的最早出现位置
      map[status] = i;
    }
  }

  return maxLen;
};

Java算法源码

import java.util.Arrays;

class Solution {
  public int findTheLongestSubstring(String s) {
    // "前缀子串"中各个元音的奇偶状态
    // 00000
    // aeiou
    // 元音字母和二进制位的对应关系如上,如果二进制位值位0,代表对应元音字符数量有偶数个,如果二进制位值为1,代表对应元音字符数量有奇数个
    // 初始未遍历时,没有子串,此时各个元音的数量都为0,即偶数个,因此所有二进制位值位0
    int status = 0b00000;

    // map记录某个状态的最早出现位置
    // 压缩状态用五位二进制数表示,因此最多有32种状态
    int[] map = new int[32]; // -2是一个不可能的位置
    Arrays.fill(map, -2);

    // 00000 状态对应的十进制数为0,最早出现位置是-1,即未遍历,没有子串时
    map[0] = -1;

    // 记录最长的符合要求的子串长度
    int maxLen = 0;

    for (int i = 0; i < s.length(); i++) {
      // 如果遍历的字符s[i]是元音字母,则变更对应二进制位的奇偶性
      switch (s.charAt(i)) {
        case 'a':
          status ^= 0b10000;
          break;
        case 'e':
          status ^= 0b01000;
          break;
        case 'i':
          status ^= 0b00100;
          break;
        case 'o':
          status ^= 0b00010;
          break;
        case 'u':
          status ^= 0b00001;
          break;
      }

      // 如果对应状态的最早出现位置为-2,表示没有出现过对应状态,否则map[status]即status状态最早出现的位置
      if (map[status] != -2) {
        // 当前位置 i 的状态为status,而最早出现status状态的位置是 map[status],两个位置同奇偶性,因此他们形成的范围内子串是符合要求的
        maxLen = Math.max(maxLen, i - map[status]);
      } else {
        // 如果对应状态之前未出现过,则当前位置 i 就是该状态的最早出现位置
        map[status] = i;
      }
    }

    return maxLen;
  }
}

Python算法源码

class Solution(object):
    def findTheLongestSubstring(self, s):
        """
        :type s: str
        :rtype: int
        """
        # "前缀子串"中各个元音的奇偶状态
        # 00000
        # aeiou
        # 元音字母和二进制位的对应关系如上,如果二进制位值位0,代表对应元音字符数量有偶数个,如果二进制位值为1,代表对应元音字符数量有奇数个
        # 初始未遍历时,没有子串,此时各个元音的数量都为0,即偶数个,因此所有二进制位值位0
        status = 0b00000

        # map记录某个状态的最早出现位置, -2是一个不可能的位置, 即初始时各个状态都没有出现过
        # 压缩状态用五位二进制数表示,因此最多有32种状态
        map = [-2] * 32
        # 00000 状态对应的十进制数为0,最早出现位置是-1,即未遍历,没有子串时
        map[0] = -1

        # 记录最长的符合要求的子串长度
        maxLen = 0

        for i in range(len(s)):
            c = s[i]

            # 如果遍历的字符s[i]是元音字母,则变更对应二进制位的奇偶性
            if c == 'a':
                status ^= 0b10000
            elif c == 'e':
                status ^= 0b01000
            elif c == 'i':
                status ^= 0b00100
            elif c == 'o':
                status ^= 0b00010
            elif c == 'u':
                status ^= 0b00001

            # 如果对应状态的最早出现位置为-2,表示没有出现过对应状态,否则map[status]即status状态最早出现的位置
            if map[status] != -2:
                # 当前位置 i 的状态为status,而最早出现status状态的位置是 map[status],两个位置同奇偶性,因此他们形成的范围内子串是符合要求的
                maxLen = max(maxLen, i - map[status])
            else:
                # 如果对应状态之前未出现过,则当前位置 i 就是该状态的最早出现位置
                map[status] = i

        return maxLen

C算法源码

int findTheLongestSubstring(char* s) {
    // "前缀子串"中各个元音的奇偶状态
    // 00000
    // aeiou
    // 元音字母和二进制位的对应关系如上,如果二进制位值位0,代表对应元音字符数量有偶数个,如果二进制位值为1,代表对应元音字符数量有奇数个
    // 初始未遍历时,没有子串,此时各个元音的数量都为0,即偶数个,因此所有二进制位值位0
    int status = 0b00000;

    // map记录某个状态的最早出现位置
    // 压缩状态用五位二进制数表示,因此最多有32种状态
    int map[32];
    for(int i=0; i<32; i++) map[i] = -2;  // -2是一个不可能的位置,即初始时所有状态都未出现过

    // 00000 状态对应的十进制数为0,最早出现位置是-1,即未遍历,没有子串时
    map[0] = -1;

    // 记录最长的符合要求的子串长度
    int maxLen = 0;

    int i=0;
    while(s[i] != '\0') {
        char c = s[i];

        // 如果遍历的字符s[i]是元音字母,则变更对应二进制位的奇偶性
        switch(c) {
            case 'a':
                status ^= 0b10000;
                break;
            case 'e':
                status ^= 0b01000;
                break;
            case 'i':
                status ^= 0b00100;
                break;
            case 'o':
                status ^= 0b00010;
                break;
            case 'u':
                status ^= 0b00001;
                break;
        }

        // 如果对应状态的最早出现位置为-2,表示没有出现过对应状态,否则map[status]即status状态最早出现的位置
        if (map[status] != -2) {
            // 当前位置 i 的状态为status,而最早出现status状态的位置是 map[status],两个位置同奇偶性,因此他们形成的范围内子串是符合要求的
            maxLen = (int) fmax(maxLen, i - map[status]);
        } else {
            // 如果对应状态之前未出现过,则当前位置 i 就是该状态的最早出现位置
            map[status] = i;
        }

        i++;
    }

    return maxLen;
}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1378967.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【Git】的工作流程简介

目录 Git的工作区域Git的基本流程 1.将工作区的代码添加到暂存区2.将暂存区的文件提交到本地仓库3.将暂存区的文件提交到远程仓库 Git的工作区域 Git的基本流程 图形化方式操作 命令行模式&#xff08;Linux系统常用&#xff09;操作 1.将工作区的代码添加到暂存区 查看文件状…

架构03 - 理解构架的视角

学习架构时&#xff0c;首要任务是弄清楚不同视角对于架构的理解&#xff0c;因为每个人对于架构的理解可能存在差异。不同职位对于架构的关注点也不同。开发人员更多关注开发架构&#xff0c;售前人员更多关注业务架构&#xff0c;运维人员更多关注运维架构&#xff0c;技术支…

基于SSM的电脑测评系统(有报告)。Javaee项目。ssm项目。

演示视频&#xff1a; 基于SSM的电脑测评系统&#xff08;有报告&#xff09;。Javaee项目。ssm项目。 项目介绍&#xff1a; 采用M&#xff08;model&#xff09;V&#xff08;view&#xff09;C&#xff08;controller&#xff09;三层体系结构&#xff0c;通过Spring Spri…

书生·浦语大模型--第二节课作业

书生浦语大模型--第二节课作业 基础部分生成300字小故事hugging face 下载功能 进阶部分浦语灵笔的图文理解及创作部署Lagent 工具调用 Demo 创作部署 基础部分 生成300字小故事 hugging face 下载功能 hugging face被墙了&#xff0c;在本地电脑无论是不是科学上网&#xff…

用通俗易懂的方式讲解:对 embedding 模型进行微调,我的大模型召回效果提升了太多了

QA对话目前是大语言模型的一大应用场景&#xff0c;在QA对话中&#xff0c;由于大语言模型信息的滞后性以及不包含业务知识的特点&#xff0c;我们经常需要外挂知识库来协助大模型解决一些问题。 在外挂知识库的过程中&#xff0c;embedding模型的召回效果直接影响到大模型的回…

使用Sqoop将数据从Hadoop导出到关系型数据库

当将数据从Hadoop导出到关系型数据库时&#xff0c;Apache Sqoop是一个非常有用的工具。Sqoop可以轻松地将大数据存储中的数据导出到常见的关系型数据库&#xff0c;如MySQL、Oracle、SQL Server等。本文将深入介绍如何使用Sqoop进行数据导出&#xff0c;并提供详细的示例代码&…

Android Studio 实现网易新闻App (简单方便易懂)

&#x1f345;文章末尾有获取完整项目源码方式&#x1f345; 目录 前言 一、任务介绍 1.1 背景 1.2目的和意义 二、 实现介绍 视频演示 2.1 启动页实现 2.2 注册页面实现 2.3 登陆页面实现 2.4 首页实现 2.5 详情页面实现 三、获取源码 前言 随着移动互联网的持续发…

力扣120. 三角形最小路径和(Java 动态规划)

Problem: 120. 三角形最小路径和 文章目录 题目描述思路解题方法复杂度Code 题目描述 思路 Problem:64. 最小路径和 本题目可以看作是在上述题目的基础上改编而来&#xff0c;具体的思路&#xff1a; 1.记录一个int类型的大小的 n 乘 n n乘n n乘n的数组&#xff08;其中 n n n为…

第九讲 单片机驱动彩色液晶屏 控制RA8889软件:显存操作

单片机驱动TFT彩色液晶屏系列讲座 目录 第一讲 单片机最小系统STM32F103C6T6通过RA8889驱动彩色液晶屏播放视频 第二讲 单片机最小系统STM32F103C6T6控制RA8889驱动彩色液晶屏硬件框架 第三讲 单片机驱动彩色液晶屏 控制RA8889软件:如何初始化 第四讲 单片机驱动彩色液晶屏 控…

日志审计系统Agent项目创建——读取日志文件(Linux版本)

紧接着上一篇的分享&#xff0c;继续做日志文件的读取&#xff0c;点击连接即可日志文件初始化https://blog.csdn.net/wjl990316fddwjl/article/details/135553238 1、将指针移动到文件末尾 //文件移动到结尾fseek(fp, 0, SEEK_END); 2、定义当前指针的位置 lastPosition ft…

人工智能:我的学习之旅与认知探索(第1版)

&#x1f31f;&#x1f30c; 欢迎来到知识与创意的殿堂 — 远见阁小民的世界&#xff01;&#x1f680; &#x1f31f;&#x1f9ed; 在这里&#xff0c;我们一起探索技术的奥秘&#xff0c;一起在知识的海洋中遨游。 &#x1f31f;&#x1f9ed; 在这里&#xff0c;每个错误都…

2024年第1周,第一期技术动态

大家好&#xff0c;才是真的好。 今天周五&#xff0c;我们继续介绍与Domino相关产品新闻&#xff0c;以及互联网或其他IT行业动态等。 一、Notes/Domino V9和V10技术支持结束和假消息 今年2024年6月1号&#xff0c;HCL将结束IBM Notes/Domino 9.0.x和10.0.x产品的技术支持声…

【发票识别】支持pdf、ofd、图片格式(orc、信息提取)的发票

背景 为了能够满足识别各种发票的功能&#xff0c;特地开发了当前发票识别的功能&#xff0c;当前的功能支持pdf、ofd、图片格式的发票识别&#xff0c;使用到的技术包括文本提取匹配、ocr识别和信息提取等相关的技术&#xff0c;用到机器学习和深度学习的相关技术。 体验 体…

强化学习应用(三):基于Q-learning的无人机物流路径规划研究(提供Python代码)

一、Q-learning简介 Q-learning是一种强化学习算法&#xff0c;用于解决基于马尔可夫决策过程&#xff08;MDP&#xff09;的问题。它通过学习一个价值函数来指导智能体在环境中做出决策&#xff0c;以最大化累积奖励。 Q-learning算法的核心思想是通过不断更新一个称为Q值的…

类图作业

类图作业 一. 简答题&#xff08;共5题&#xff0c;100分&#xff09; (简答题) 在对类名、属性 /方法名时&#xff0c;通常会遵循什么样的规则&#xff1f;请举例说明。 正确答案&#xff1a; 对于类名通常采用 CamelCase格式&#xff08;大写字母开头、混合大小写&#xff0…

Spark---RDD持久化

文章目录 1.RDD持久化1.1 RDD Cache 缓存1.2 RDD CheckPoint 检查点1.3 缓存和检查点区别 1.RDD持久化 在Spark中&#xff0c;持久化是将RDD存储在内存中&#xff0c;以便在多次计算之间重复使用。这可以显著减少不必要的计算&#xff0c;提高Spark应用程序的性能。 val line…

MATLAB - 四旋翼飞行器动力学方程

系列文章目录 前言 本例演示了如何使用 Symbolic Math Toolbox™&#xff08;符号数学工具箱&#xff09;推导四旋翼飞行器的连续时间非线性模型。具体来说&#xff0c;本例讨论了 getQuadrotorDynamicsAndJacobian 脚本&#xff0c;该脚本可生成四旋翼状态函数及其雅各布函数…

Hive基础知识(十):Hive导入数据的五种方式

1. 向表中装载数据&#xff08;Load&#xff09; 1&#xff09;语法 hive> load data [local] inpath 数据的 path[overwrite] into table student [partition (partcol1val1,…)]; &#xff08;1&#xff09;load data:表示加载数据 &#xff08;2&#xff09;local:表示…

蓝桥杯练习题(五)

&#x1f4d1;前言 本文主要是【算法】——蓝桥杯练习题&#xff08;五&#xff09;的文章&#xff0c;如果有什么需要改进的地方还请大佬指出⛺️ &#x1f3ac;作者简介&#xff1a;大家好&#xff0c;我是听风与他&#x1f947; ☁️博客首页&#xff1a;CSDN主页听风与他 …

UE4工程升级UE5教程及注意事项

原文链接&#xff1a;https://mp.weixin.qq.com/s/vSVu0VsNub0J62Nz7vM6cA虚幻引擎5迁移指南 | 虚幻引擎5.3文档 (unrealengine.com) 官方教程应该是从英文直接翻译过来的&#xff0c;过多词汇没修改&#xff0c;本篇重新整理修改一下&#xff0c;供各位参考。 本教程介绍&…