- 583. 两个字符串的删除操作
- 72. 编辑距离
- 编辑距离总结篇
第一题:两个字符串的删除操作
给定两个单词 word1 和 word2,找到使得 word1 和 word2 相同所需的最小步数,每步可以删除任意一个字符串中的一个字符。
示例:
- 输入: "sea", "eat"
- 输出: 2
- 解释: 第一步将"sea"变为"ea",第二步将"eat"变为"ea"
相比之前的题,本题特点在于:找到两个字符串中相同的子串,两边都可以删除操作,子串的相对排列顺序不变。
动态规划五部曲:
(1)确定dp数组以及下标的含义
dp[i][j]:以i-1为结尾的字符串word1,和以j-1为结尾的字符串word2,想要达到相等,所需要删除元素的最小次数。。。。。。。两边都计算在内吗?
(2)确定递推公式
情况一:当word1[i-1]和word2[j-1]相同的时候
情况二:当word1[i-1]和word2[j-1]不相同的时候
当word1[i - 1] 与 word2[j - 1]相同的时候,dp[i][j] = dp[i - 1][j - 1]; 意思就是当前字符相同,需要删除的元素次数跟前一个元素对应的值相同
当word1[i-1]与word2[j-1]不相同的时候,有三种情况::
情况1:删除word1[i-1],最少操作次数dp[i-1][j]+1;
情况2:删除word2[j-1],最少操作次数dp[i][j-1]+1; 相当于i-1位置的元素1和j-1位置的元素2不相同,回到i-1位置和j-2位置再比较,同时删除操作+1;或者回到i-2和j-1位置再比较,删除操作+1
情况3:同时删除word1[i-1]和word2[j-1],操作最少次数为dp[i-1][j-1]+2
最后取三种情况中的最小值:
dp[i][j]=min(dp[i-1][j]+1,dp[i][j-1]+1,dp[i-1][j-1]+2)
(3)dp数组如何初始化
根据推导公式,dp[0][j]和dp[i][0]一定需要初始化,根据数组定义,只要i=0,或者j=0,dp[i][j]都没有合适的子串,不为0的字符串全部需要删除i次或者j次,所以dp[i][0]=i; dp[0][j]=j
(4)确定遍历顺序
从上到下,从左到右
(5)举例推导
dp[1][1]=min(dp[0][1]+1,dp[1][0]+1,dp[0][0]+2)=2
dp[1][2]=min(dp[0][2]+1,dp[1][1]+1,dp[0][1]+2)=3
。。。
第二题:编辑距离
给你两个单词 word1 和 word2,请你计算出将 word1 转换成 word2 所使用的最少操作数 。
你可以对一个单词进行如下三种操作:
-
插入一个字符
-
删除一个字符
-
替换一个字符
-
示例 1:
-
输入:word1 = "horse", word2 = "ros"
-
输出:3
将一个字符串转变为另一个字符串,增删改最少操作次数
(1)确定dp数组以及下标的含义
dp[i][j]表示以下标i-1为结尾的字符串word1,和以下标j-1为结尾的字符串word2,最近编辑距离为dp[i][j]
(2)确定推导公式
情况1:word1[i-1]==word2[j-1] dp[i][j]=dp[i-1][j-1]
情况2:word1[i-1]不等于word2[j-1]
可对字符串增加、删除、换
操作一:word1删除一个元素,那么就是以下标i - 2为结尾的word1 与 j-1为结尾的word2的最近编辑距离 再加上一个操作。
即 dp[i][j] = dp[i - 1][j] + 1;
操作二:word2删除一个元素,那么就是以下标i - 1为结尾的word1 与 j-2为结尾的word2的最近编辑距离 再加上一个操作。
即 dp[i][j] = dp[i][j - 1] + 1;
word1增加元素,等于word2删除元素,所以增加操作和删除操作是一体的
操作三:替换元素,word1
替换word1[i - 1]
,使其与word2[j - 1]
相同,此时不用增删加元素。
可以回顾一下,if (word1[i - 1] == word2[j - 1])
的时候我们的操作 是 dp[i][j] = dp[i - 1][j - 1]
对吧。
那么只需要一次替换的操作,就可以让 word1[i - 1] 和 word2[j - 1] 相同。
所以 dp[i][j] = dp[i - 1][j - 1] + 1;
综上:dp[i][j]取最小的值
dp[i][j]=min({dp[i-1][j-1],dp[i-1][j],dp[i][j-1]})+1
(3)dp数组初始化
跟上题相同,dp[i][0]和dp[0][j]均需要初始化,0字符串和其他长度的字符串的最小操作均为对方长度,所以dp[i][0]=i; dp[0][j]=j
(4)确定遍历顺序
根据递推公式,dp[i][j]的遍历顺序应该是从上到下,从左到右
(5)举例推导
dp[1][1]对应的两个字符不相同,属于第二种情况
即dp[1][1]=min({dp[i-1][j-1],dp[i-1][j],dp[i][j-1]})+1=min(0,1,1)+1=1
...