Day56【动态规划】583.两个字符串的删除操作、72.编辑距离

news2024/11/24 10:35:03

583.两个字符串的删除操作

力扣题目链接/文章讲解

视频讲解

1、确定 dp 数组下标及值含义

dp[i][j]:以下标 i 为结尾的字符串 word1,和以下标 j 为结尾的字符串 word2,想要达到相等,所需要删除元素的最少次数为 dp[i][j]

2、确定递推公式 

当 word1[i] == word2[j] 时:

这个时候只需要考虑怎么对 word1[0, i - 1] 和 word2[0, j - 1] 删除到相同即可

即 dp[i][j] = dp[i - 1][j - 1] 

当 word1[i] != word2[j] 时: 

  • 可以先删除 word1[i],然后再对 word1[0, i - 1] 和 word2[0,  j] 删除到相同

即 dp[i - 1][j] + 1,其中 +1 表示“先删除 word1[i]”,dp[i - 1][j] 是对 word1[0, i - 1] 和 word2[0,  j] 删除到相同所需要的最少次数

  • 可以先删除 word2[j],然后再对 word1[0, i] 和 word2[0,  j - 1] 删除到相同

即 dp[i][j - 1] + 1,其中 +1 表示“先删除 word2[j]”,dp[i][j - 1] 是对 word1[0, i] 和 word2[0,  j - 1] 删除到相同所需要的最少次数

因为求最少,这两种删除的方式所需要删除元素的最少次数取最小即为 dp 值

即 dp[i][j] = min(dp[i - 1][j] + 1, dp[i][j - 1] + 1)

始终别忘了我们 dp 数组的值是删除元素的最少次数! 

3、dp 数组初始化

需要初始化 dp[i][0] 和 dp[0][j]

dp[i][0]:以 i 为结尾的字符串 word1,和 word2[0] 想要达到相等,所需要删除元素的最少次数

dp[0][j]:以 j 为结尾的字符串 word2,和 word1[0] 想要达到相等,所需要删除元素的最少次数

我们发现到这里,很难初始化!

怎么办呢,用我们之前的思路,更改 dp[i][j] 的定义,重新来一遍

1、确定 dp 数组下标及值含义

dp[i][j]:以下标 i - 1 为结尾的字符串 word1,和以下标 j - 1 为结尾的字符串 word2,想要达到相等,所需要删除元素的最少次数为 dp[i][j]

2、确定递推公式 

还是按照我们之前的思路

当 word1[i - 1] == word2[j - 1] 时:

这个时候只需要考虑怎么对 word1[0, i - 2] 和 word2[0, j - 2] 删除到相同即可

即 dp[i][j] = dp[i - 1][j - 1] 

当 word1[i - 1] != word2[j - 1] 时: 

  • 可以先删除 word1[i - 1],然后再对 word1[0, i - 2] 和 word2[0,  j - 1] 删除到相同

即 dp[i - 1][j] + 1

  • 可以先删除 word2[j],然后再对 word1[0, i] 和 word2[0,  j - 1] 删除到相同

即 dp[i][j - 1] + 1

因为求最少,这两种删除的方式所需要删除元素的最少次数取最小即为 dp 值

即 dp[i][j] = min(dp[i - 1][j] + 1, dp[i][j - 1] + 1)

始终别忘了我们 dp 数组的值是删除元素的最少次数! 

3、dp 数组初始化

需要初始化 dp[i][0] 和 dp[0][j]

dp[i][0]:以下标 i - 1 为结尾的字符串 word1,和空字符串想要达到相等,所需要删除元素的最少次数,即将 word1 中的 i 个字符(下标 0 到下标 i - 1 总共有 i 个字符)全删了,dp[i][0] = i

dp[0][j]:以下标 j - 1 为结尾的字符串 word2,和空字符串想要达到相等,所需要删除元素的最少次数,即将 word2 中的 j 个字符全删了,dp[0][j] = j

4、确定遍历顺序:从上向下,从左往右遍历填充 dp 数组

5、打印 dp 数组验证

代码如下

class Solution {
public:
    int minDistance(string word1, string word2) {
        // dp[i][j]:以下标i-1为结尾的字符串word1,和以下标j-1为结尾的字符串word2,想要达到相等,所需要删除元素的最少次数为dp[i][j],dp下标最大值-1要能达到字符串的结尾,故dp维度要比word维度多1

        vector<vector<int> > dp(word1.size() + 1, vector<int>(vector<int>(word2.size() + 1)));

        for (int i = 0; i <= word1.size(); ++i) {
           dp[i][0] = i; 
        }
        for (int j = 0; j <= word2.size(); ++j) {
           dp[0][j] = j; 
        }

        for (int i = 1; i <= word1.size(); ++i) {    // 从上到下,从左往右填充
            for (int j = 1; j <= word2.size(); ++j) {
                if (word1[i - 1] == word2[j - 1]) {
                   dp[i][j] = dp[i - 1][j - 1];    // 直接考虑该怎么对word1[i-2]和word2[j-2]做删除操作
                }
                else {
                    dp[i][j] = min(dp[i - 1][j] + 1, dp[i][j - 1] + 1);
                    // 先删除一个,再考虑怎么对剩下的做删除操作
                }
            }
        }

        return dp[word1.size()][word2.size()];

    }
};

本题我们真真切切体验到了,哪怕思路相同,不同定义 dp 的方式带来的代码难度也会不同

另一种思路,只要求出两个字符串的最长公共子序列长度即可,那么除了最长公共子序列之外的字符都是必须删除的,最后用两个字符串的总长度减去两个最长公共子序列的长度就是删除的最少步数

class Solution {
public:
    int minDistance(string word1, string word2) {

        vector<vector<int> > dp(word1.size() + 1, vector<int>(word2.size() + 1, 0));

        for (int i = 1; i <= word1.size(); ++i) {
            for (int j = 1; j <= word2.size(); ++j) {
                if (word1[i - 1] == word2[j - 1])
                    dp[i][j] = dp[i - 1][j - 1] + 1;
                else
                    dp[i][j] = max(dp[i - 1][j], dp[i][j - 1]);
            }
        }
        return word1.size() + word2.size() - 2 * dp[word1.size()][word2.size()];
    }
};

72.编辑距离

力扣题目链接/文章讲解 

视频讲解 

上一道题只能删除操作,这道题可以插入、删除、替换 

1、确定 dp 数组下标及值含义

dp[i][j]:以下标 i - 1 为结尾的字符串 word1,和以下标 j - 1 为结尾的字符串 word2,想要达到相等,所需要的最少操作次数为 dp[i][j]

这里为什么定义以下标-1为结尾,上一道题目体验过了,就是为了方便初始化

2、确定递推公式

考虑怎么让以下标 i - 1 为结尾的字符串 word1,和以下标 j - 1 为结尾的字符串 word2 变得相同,必然涉及到比较元素 

当 word1[i - 1] == word2[j - 1] 时:

这个时候只需要考虑怎么对 word1[0, i - 2] 和 word2[0, j - 2] 操作到相同即可

即 dp[i][j] = dp[i - 1][j - 1] 

当 word1[i - 1] != word2[j - 1] 时:

这部分是难点! 

考虑下一步可以执行三种操作

  • 删除操作
  1. 可以先删除 word1[i - 1],然后再对 word1[0, i - 2] 和 word2[0,  j - 1] 操作到相同,此时最少操作数为 dp[i - 1][j] + 1(+1 代表先执行的删除操作,dp[i - 1][j] 为对 word1[0, i - 2] 和 word2[0,  j - 1] 操作到相同所需要的最少操作数)
  2. 可以先删除 word2[j - 1],然后再对 word1[0, i - 1] 和 word2[0, j - 1] 操作到相同,此时最少操作数为 dp[i][j - 1] + 1
  • 插入操作:插入操作的次数和删除操作的次数是一样的,互为逆向操作。word2添加一个元素,相当于word1删除一个元素 

我们还是推导一下来证明插入和删除操作的次数是一样的。可以先在 word1[0, i - 1] 末尾加一个 word2[i - 1],然后再对 word1[0, i - 1] 和 word2[0, j - 2] 操作到相同。此时最少操作数为 dp[i][j - 1] + 1,即删除操作中的第二种情况。

如果先在 word2[0, j - 1] 末尾加一个 word1[i - 1],然后再对 word1[0, i - 2] 和 word2[0, j - 1] 操作到相同,则对应删除操作中的第一种情况,为 dp[i - 1][j] + 1

  • 替换操作

先将 word1[i - 1] 或 word2[j - 1] 替换为相同元素,然后再对 word1[0, i - 2] 和 word2[0, j - 2] 操作到相同。此时最少操作数为 dp[i - 1][j - 1] + 1(+1 代表先执行的替换操作,dp[i - 1][j - 1] 为对 word1[0, i - 2] 和 word2[0, j - 2] 操作到相同所需要的最少操作数)

综上所述,当 word1[i - 1] != word2[j - 1] 时,取上述每种操作所有情况的最小值

dp[i][j] = min(dp[i - 1][j] + 1, dp[i][j - 1] + 1, dp[i - 1][j - 1] + 1)

if (word1[i - 1] == word2[j - 1]) {
    dp[i][j] = dp[i - 1][j - 1];
}
else {
    dp[i][j] = min({dp[i - 1][j - 1], dp[i - 1][j], dp[i][j - 1]}) + 1;
}

3、dp 数组初始化

需要初始化第一行和第一列 

再回顾一下dp[i][j]的定义:

dp[i][j]:以下标 i - 1 为结尾的字符串 word1,和以下标 j - 1 为结尾的字符串 word2,最近编辑距离为 dp[i][j]

那么 dp[i][0] 和 dp[0][j] 表示什么呢?

dp[i][0] :以下标 i - 1 为结尾的字符串 word1,和空字符串 word2,最近编辑距离为 dp[i][0]

那么 dp[i][0] 就应该是 i,对 word1[0, i - 1] 里的元素全部做删除操作,即:dp[i][0] = i

同理dp[0][j] = j

4、确定遍历顺序 

dp[i][j] 是依赖左方,上方和左上方元素,需要从左到右从上到下去遍历填充

5、打印 dp 数组验证

代码如下

class Solution {
public:
    int minDistance(string word1, string word2) {
        
        // 定义dp数组,注意dp数组的大小
        vector<vector<int> > dp(word1.size() + 1, vector<int>(word2.size() + 1));
        
        // 初始化
        for (int i = 0; i <= word1.size(); ++i) {
            dp[i][0] = i;
        }
        for (int j = 0; j <= word2.size(); ++j) {
            dp[0][j] = j;
        }

        for (int i = 1; i <= word1.size(); ++i) {
            for (int j = 1; j <= word2.size(); ++j) {
                if (word1[i - 1] == word2[j - 1])    // 直接对word1[0,i-2]和word2[0,j-2]操作
                    dp[i][j] = dp[i - 1][j - 1];
                else {
                    // 先删除或添加,再对剩下的操作、先替换,再对剩下的操作
                    dp[i][j] = min({dp[i - 1][j] + 1, dp[i][j - 1] + 1, dp[i - 1][j - 1] + 1});
                }
            }
        }

        return dp[word1.size()][word2.size()];
    }
};

回顾总结 

编辑距离问题结束

总结一下最近的题目,都是操作两个字符串,定义 dp 数组和确定递推公式都挺难的 

确定递推公式时,一般需要考虑比较元素相等或不相等两种情况

动态规划分解为子问题的思想需要贯穿(先执行了某个操作后,后续操作是否可以由其他 dp 值推导而来) 

 

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/588314.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【1110. 删点成林】

来源&#xff1a;力扣&#xff08;LeetCode&#xff09; 描述&#xff1a; 给出二叉树的根节点 root&#xff0c;树上每个节点都有一个不同的值。 如果节点值在 to_delete 中出现&#xff0c;我们就把该节点从树上删去&#xff0c;最后得到一个森林&#xff08;一些不相交的…

LeetCode——可被三整除的偶数的平均值

#全国科技者工作日—为创新和未来而努力# 目录 1、题目 2、题目解读 3、代码 1、题目 2455. 可被三整除的偶数的平均值 - 力扣&#xff08;Leetcode&#xff09; 给你一个由正整数组成的整数数组 nums &#xff0c;返回其中可被 3 整除的所有偶数的平均值。 注意&#xff…

论文阅读:Directed Greybox Fuzzing

一、论文相关信息 二、现有研究的不足 现有的Greybox模糊器&#xff08;GF&#xff09;无法有效地定向到有问题的更改或补丁、关键系统调用或危险位置、或定向到我们希望重现的已报告漏洞的堆栈跟踪中的函数。 三、知识点 &#xff08;1&#xff09;introduction 定向模糊测试…

第二章(一):Django框架的模型(Model)

系列文章目录 备注&#xff1a;这里是Django系列文章的所有文章的目录 第一章(一) : Django框架如何创建项目、创建应用、创建templates&#xff1b;如何启动django项目&#xff1b; 第一章(二)&#xff1a;Django框架的模式、路由、视图&#xff1b; 第一章(三)&#xff1a;Dj…

learn C++ NO.7——C/C++内存管理

引言 现在是5月30日的正午&#xff0c;图书馆里空空的&#xff0c;也许是大家都在午休&#xff0c;也许是现在37摄氏度的气温。穿着球衣的我已经汗流浃背&#xff0c;今天热火战胜了凯尔特人&#xff0c;闯入决赛。以下克上的勇气也激励着我&#xff0c;在省内垫底的大学中&am…

JS的异或运算XOR

概念 异或&#xff08;xor&#xff09;是一个数学运算符。它应用于逻辑运算。异或的数学符号为“⊕”&#xff0c;计算机符号为“xor”。 两个值相同时&#xff0c;返回false&#xff0c;否则返回true。也就是说&#xff0c;XOR可以用来判断两个值是否不同。 JavaScript 语言…

企业级信息系统开发——Spring Boot加载自定义配置文件

文章目录 一、使用PropertySource加载自定义配置文件&#xff08;一&#xff09;创建Spring Boot Web项目ConfigDemo01&#xff08;二&#xff09;创建自定义配置文件&#xff08;三&#xff09;创建自定义配置类&#xff08;四&#xff09;编写测试方法&#xff08;五&#xf…

一键部署属于自己的ChatGPT-Next-Web

完整功能刚需&#xff1a; OpenAI 注册登录之后给的 api Key GitHub账号 Netlify账号 Tip&#xff1a; 注册 OepenAI账号 需要用国外手机号 这里建议去一些渠道购买账号 十块钱不到如果访问 OpenAI 的话 一定要挂欧美节点 否则禁止IP访问 概率会被封号为什么用 Netlify 托…

测试替身Test Doubles的5类型(Mockito)

测试替身Test Doubles的5类型(Mockito) 我们有一个名为 BankAccount 的类。 数据库用于存储和检索银行帐户信息。 我们想测试 BankAccount 中的逻辑&#xff0c;而不必担心它使用的底层数据库.由此类实现——它将 SQL 查询发送到数据库并返回其中包含的值。 测试替身Test Dou…

SuperMap iDesktopX扩展开发之GPA算子扩展

作者&#xff1a;dongyx SuperMap iDesktopX是超图研究院推出的一款跨平台的桌面GIS软件&#xff0c;兼容Windows和Linux&#xff0c;同时iDesktopX也采用的是插件式扩展开发框架&#xff0c;支持定制开发。 使用iDesktopX定制开发有以下优势&#xff1a; ⚫ 采用 Swing 图形界…

VM虚拟机仿真网络问题

在电子数据取证中&#xff0c;拿到一个镜像需要仿真的时候&#xff0c;经常会遇到网络问题。尤其是Linux服务器镜像&#xff0c;例如centos操作系统的镜像&#xff0c;一般镜像会有固定IP设置&#xff0c;仿真起来后&#xff0c;系统与本机不能建立连接&#xff0c;不能连接互联…

VSCode远程连接Ubuntu使用LLDB调试程序

VSCode已经具有远程开发的能力&#xff0c;可以使用SSH连接到Linux/MacOS进行远程开发&#xff0c;包括编译与调试&#xff0c;只需要安装Remote Development插件即可&#xff0c;如果想使用CMake管理项目&#xff0c;则需要将VSCode的CMake以及CMake Tools插件安装在远程机器上…

SpringBoot自定义打印横幅

众所周知&#xff0c;springboot项目启动的时候会打印横幅&#xff0c;横幅内容就是spring; 而spring boot提供了一个Banner接口用于处理启动横幅&#xff0c;默认情况下启动会打印如下信息 . ____ _ __ _ _/\\ / ____ __ _ _(_)_ __ __ _ \ \ \ \ ( (…

分布式系统

一.分布式理论基础 1.CAP理论 CAP定理是分布式系统中的重要理论&#xff0c;在一个分布式系统中最多只能同时满足一致性&#xff08;Consistency&#xff09;、可用性&#xff08;Availability&#xff09;和分区容错性&#xff08;Partition tolerance&#xff09;这三项中的…

以太网驱动的流程浅析(五)-mii_bus初始化以及phy id的获取

【硬件环境】 Imx6ul 【Linux kernel版本】 Linux4.1.15 【以太网phy】 Realtek8201f 1.1. 以太网驱动probe流程 1.1 mii_bus初始化以及phy id的获取 然后进行mii的一些初始化fec_enet_mii_init(pdev); 主要是对struct mii_bus这里的成员进行初始化 并且会做注册mdiobus的…

小笔记-简单但够用系列_jupyter notebook 的重新安装问题

文章目录 目的目标步骤 目的 做程序开发时&#xff0c;想到 jupyter notebook 的浏览器交互式执行&#xff0c;决定再次启用放置许久的 jupyter notebook。 但太久没有执行的 jupyter notebook 在打开页面有一旦打开或创建新的 python&#xff0c;就自动报错退出。 使用过往经…

Blender UV展开流程

目录 1. UV1.1 blender默认物体1.2 创建物体1.3 UV参考图1.4 标记缝合边1.5 UV拉伸1.6 孤岛模式 1. UV 1.1 blender默认物体 默认物体已经自动生成UV 在UV编辑工作区&#xff0c;编辑模式&#xff0c;全选物体在左边自动展开UV 在物体数据属性-UV贴图-存在默认的UV贴图&#…

华为OD机试真题B卷 Java 实现【输入整型数组和排序标识,对其元素按照升序或降序进行排序】,附详细解题思路

一、题目描述 输入整型数组和排序标识,对其元素按照升序或降序进行排序 数据范围: 1≤n≤1000 ,元素大小满足 0≤val≤100000 。 二、输入描述 第一行输入数组元素个数;第二行输入待排序的数组,每个数用空格隔开;第三行输入一个整数0或1。0代表升序排序,1代表降序排序…

UOS桌面系统使用RLinux恢复数据

UOS桌面系统使用RLinux恢复数据 一、工具介绍二、注意事项三、准备四、制作live系统启动盘五、拷贝文件六、进入live系统一、工具介绍 R-Linux 是一款用于 Linux 和某些 Unixes 操作系统 Ext2/Ext3/Ext4 FS 文件系统的免费文件恢复实用工具。R-Linux 与 R-Studio 使用相同的 I…

如何使用ArcGIS进行选房分析

无论是城市规划布局研究&#xff0c;还是为自己找一个心仪的住房&#xff0c;都需要综合考虑购物、医疗、教育和休闲等诸多因素&#xff0c;若单纯依靠人力去寻找&#xff0c;十分的麻烦和耗时。 此时ArcGIS强大的分析功能就凸显了出来&#xff0c;我们可以通过空间上的距离关…