BM65 最长公共子序列(二)

news2025/1/16 3:53:49

动态规划

BM65 最长公共子序列(二)

这道题是动态规划的典型例题。

思路

题目要求获取最长公共子序列,我们要先求最长公共子序列的长度,然后根据这个长度倒推从而获取这个子序列。注意:子序列不是子串,子串要求所有字符在原字符串中的位置必须连续,子序列不要求连续,只要求相对位置不变。这一点会影响dp数组的定义。
设存在字符串 s 1 和 s 2 ; 设存在字符串s1和s2; 设存在字符串s1s2

  1. 定义dp数组并初始化。
    d p [ i ] [ j ] 表示在截止到 s 1 [ i − 1 ] 和 s 2 [ j − 1 ] 的字符串中,最长公共子序列的 长度。注 : 在这个定义中 , 此时的最长公共子序列的末尾元素不一定 是 s 1 [ i − 1 ] 或 s 2 [ j − 1 ] dp[i][j]表示在截止到s1[i-1]和s2[j-1]的字符串中,最长公共子序列的\\长度。注:在这个定义中,此时的最长公共子序列的末尾元素不一定\\是s1[i-1]或s2[j-1] dp[i][j]表示在截止到s1[i1]s2[j1]的字符串中,最长公共子序列的长度。注:在这个定义中,此时的最长公共子序列的末尾元素不一定s1[i1]s2[j1]

这里为了省去初始化时的分类讨论,我们可以将dp数组初始化成一个 l e n g t h ( s 1 ) + 1 length(s1)+1 length(s1)+1 l e n g t h ( s 2 ) + 1 length(s2)+1 length(s2)+1列的全0数组。此时有 d p [ 0 ] [ j ] = d p [ i ] [ 0 ] = 0 dp[0][j]=dp[i][0]=0 dp[0][j]=dp[i][0]=0

  1. 从前到后遍历两个字符串,开始状态转移。状态转移方程如下:

{ d p [ i ] [ j ] = d p [ i − 1 ] [ j − 1 ] + 1 s 1 [ i − 1 ] = s 2 [ j − 1 ] d p [ i ] [ j ] = m a x ( d p [ i − 1 ] [ j ] , d p [ i ] [ j − 1 ] ) s 1 [ i − 1 ] ≠ s 2 [ j − 1 ] 1 ≤ i ≤ l e n g t h ( s 1 ) , 1 ≤ j ≤ l e n g t h ( s 2 ) \begin{align} \begin{cases} dp[i][j]=dp[i-1][j-1]+1 &s1[i-1]=s2[j-1]\\ \\ dp[i][j]=max(dp[i-1][j],dp[i][j-1]) &s1[i-1]\neq s2[j-1]\\ \\ 1\leq i\leq length(s1),1\leq j\leq length(s2) \end{cases} \end{align} dp[i][j]=dp[i1][j1]+1dp[i][j]=max(dp[i1][j],dp[i][j1])1ilength(s1),1jlength(s2)s1[i1]=s2[j1]s1[i1]=s2[j1]
解释一下这个状态转移方程。

  • s 1 [ i − 1 ] = s 2 [ j − 1 ] s1[i-1]=s2[j-1] s1[i1]=s2[j1],说明字符s1[i-1]和字符s2[j-1]相同,它们都属于最长公共子序列;在截止到s1[i-1]和s2[j-1]的字符串中最长公共子序列的长度 = 在截止到s1[i-2]和s2[j-2]的字符串中最长公共子序列的长度+1,即 d p [ i ] [ j ] = d p [ i − 1 ] [ j − 1 ] + 1 dp[i][j]=dp[i-1][j-1]+1 dp[i][j]=dp[i1][j1]+1
  • s 1 [ i − 1 ] ≠ s 2 [ j − 1 ] s1[i-1]\neq s2[j-1] s1[i1]=s2[j1],说明s1[i-1]和s2[j-1]不可能同时属于最长公共子序列,但有可能它俩其中之一属于最长公共子序列。因此 d p [ i ] [ j ] = m a x ( d p [ i − 1 ] [ j ] , d p [ i ] [ j − 1 ] ) dp[i][j]=max(dp[i-1][j],dp[i][j-1]) dp[i][j]=max(dp[i1][j],dp[i][j1])
  1. 状态转移完成后, d p [ l e n g t h ( s 1 ) ] [ l e n g t h ( s 2 ) ] dp[length(s1)][length(s2)] dp[length(s1)][length(s2)]一定是最长公共子序列的长度。

  2. d p [ l e n g t h ( s 1 ) ] [ l e n g t h ( s 2 ) ] dp[length(s1)][length(s2)] dp[length(s1)][length(s2)]开始倒推寻找最长公共子序列。根据dp数组转移的方向,不断往前组装字符。

    只有当 d p [ i ] [ j ] dp[i][j] dp[i][j]同时满足如下3个条件,才能说明字符s1[i-1]和s2[j-1]都属于最长公共子序列,将s1[i-1]或s2[j-1]添加进序列。
    { d p [ i ] [ j ] ≠ d p [ i − 1 ] [ j ] d p [ i ] [ j ] ≠ d p [ i ] [ j − 1 ] d p [ i ] [ j ] = d p [ i − 1 ] [ j − 1 ] \begin{align} \begin{cases} dp[i][j]\neq dp[i-1][j]\\ \\ dp[i][j]\neq dp[i][j-1]\\ \\ dp[i][j]=dp[i-1][j-1] \end{cases} \end{align} dp[i][j]=dp[i1][j]dp[i][j]=dp[i][j1]dp[i][j]=dp[i1][j1]

  3. 第4步得到的序列其实是最长公共子序列的逆序,将其逆转就得到了题目所求的最长公共子序列。

在这里插入图片描述

代码
import numpy as np
import  pandas as pd

#
# 代码中的类名、方法名、参数名已经指定,请勿修改,直接返回方法规定的值即可
#
# longest common subsequence
# @param s1 string字符串 the string
# @param s2 string字符串 the string
# @return string字符串
#
class Solution:
    def LCS(self, s1: str, s2: str) -> str:
        """dp[i][j]:截至到s1[i-1]和s2[j-1],搜索到的最长公共子序列长度"""
        if s1 is None or s2 is None:
            return "-1"
        dp = [[0] * (len(s2) + 1) for i in range(len(s1) + 1)]
        for i in range(1, len(s1)+1):
            for j in range(1, len(s2)+1):
                if s1[i-1] == s2[j-1]:
                    dp[i][j] = dp[i-1][j-1] + 1
                else:
                    dp[i][j] = max(dp[i-1][j], dp[i][j-1])
        # print(dp)
        #寻找最长公共子序列
        i = len(s1)
        j = len(s2)
        lcs = []
        while dp[i][j] != 0:
            if dp[i][j] == dp[i-1][j]:#如果从左方向来
                i = i-1
            elif dp[i][j] == dp[i][j-1]:#如果从上方向来
                j = j-1
            elif dp[i][j] > dp[i-1][j-1]:#只有从左上方向来才是字符相等
                i = i-1
                j = j-1
                lcs.append(s1[i])#这样得到的最长公共子序列是逆序的
        res = ''
        while len(lcs) != 0:
            res += lcs[-1] #依次将lcs中末尾元素插入
            lcs.pop() #弹出末尾元素

        #如果两个序列完全不同
        if res == '':
            return "-1"
        else:
            return res

if __name__ == '__main__':
    s1 = input()
    s2 = input()
    a = Solution()
    print(a.LCS(s1,s2))

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1200261.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

springboot的配置信息的设置和读取(application.properties/application.yml)

springboot提供了两种配置信息的文件格式,application.properties和application.yml,基于直接明了,使用方便和高效的前提下下面的配置均采用yml格式配置, 注意 yml采用缩减方式来排列键后面紧跟冒号,然后空格&#x…

数据结构—内部排序(上)

文章目录 8.内部排序(上)(1).排序基础#1.为什么是内部排序#2.排序的稳定性 (2).冒泡排序#1.算法思想#2.代码实现#3.稳定性与时间复杂度分析 (3).选择排序#1.算法思想#2.代码实现#3.稳定性与时间复杂度分析 (4).插入排序#1.算法思想#2.代码实现#3.稳定性与时间复杂度分析 (5).希…

文心一言 VS 讯飞星火 VS chatgpt (133)-- 算法导论11.2 5题

五、用go语言,假设将一个具有n个关键字的集合存储到一个大小为 m 的散列表中。试说明如果这些关键字均源于全域U,且|U|>nm,则U 中还有一个大小为n 的子集,其由散列到同一槽位中的所有关键字构成,使得链接法散列的查…

三分钟学完Git版本控制常用指令

基本指令 git clone [url] 克隆远程仓库到本地 git clone https://gitee.com/mayun2023a/mprpc.git2.git checkout -b xxx 切换至新分支xxx(相当于复制了remote的仓库到本地的xxx分支上) 3.修改或者添加本地代码(部署在硬盘的源文件上) 4.g…

LabVIEW中如何在网络上使用远程VI服务器

LabVIEW中如何在网络上使用远程VI服务器 如何在网络上使用远程VI服务器? 解答: 首先,需要在远程的计算机上打开一个在VI服务器上的LabVIEW应用程序的引用。这可以通过“Open ApplicationReference“函数实现。然后用“Open VI Reference”函数打开一个…

【入门Flink】- 10基于时间的双流联合(join)

统计固定时间内两条流数据的匹配情况,需要自定义来实现——可以用窗口(window)来表示。为了更方便地实现基于时间的合流操作,Flink 的 DataStrema API 提供了内置的 join 算子。 窗口联结(Window Join) 一…

Acer宏碁Aspire A715-75G笔记本工厂模式原厂Windows10预装OEM系统2004带恢复功能

下载链接:https://pan.baidu.com/s/1nJFd25lElc1VAPf_RqSDYA?pwdd05h 提取码:d05h 原装出厂系统自带所有驱动、Office办公软件、出厂主题壁纸、系统属性Acer宏基专属的LOGO标志、 Acer Care Center、Quick Access等预装程序 所需要工具&#xff1a…

Linux文件系统(1)

Linux文件系统(1) 📟作者主页:慢热的陕西人 🌴专栏链接:Linux 📣欢迎各位大佬👍点赞🔥关注🚓收藏,🍉留言 本博客主要内容从系统层面重新认识我们的文件系统 文…

关于值传递和引用传递的问题记录

目录 1. 问题概述 1.1 测试 1.2 结果 2. ArrayList和Arrays.ArrayList 1. 问题概述 最近忙着写论文很久没更新了&#xff0c;趁现在有时间简单记录一下最近遇到的一个坑。 对于Java中的List<>类型的对象&#xff0c;按我以前理解是引用传递&#xff0c;但有一点要注…

Java12新增特性

前言 前面的文章&#xff0c;我们对Java9、Java10、Java11的特性进行了介绍&#xff0c;对应的文章如下 Java9新增特性 Java10新增特性 Java11新增特性 今天我们来介绍一下Java12版本的新增特性 版本介绍 Java 12是Java SE的第12个版本&#xff0c;于2019年3月19日发布。这个…

fastANI-基因组平均核酸一致性(ANI)计算

文章目录 简介安装使用Many to Man-使用基因组路径作为输入One to One 结果其他参数说明可视化两个基因组之间的保守区域并行化 简介 FastANI 是为快速计算全基因组平均核苷酸同一性&#xff08;Average Nucleotide Identity&#xff0c;ANI&#xff09;而开发的&#xff0c;无…

【第七章】软件设计师 之 程序设计语言与语言程序处理程序基础

文章底部有个人公众号&#xff1a;热爱技术的小郑。主要分享开发知识、学习资料、毕业设计指导等。有兴趣的可以关注一下。为何分享&#xff1f; 踩过的坑没必要让别人在再踩&#xff0c;自己复盘也能加深记忆。利己利人、所谓双赢。 1、前言 正规式 2、编译过程 编译型&…

深度解析找不到msvcp120.dll相关问题以及解决方法

​在计算机使用过程中&#xff0c;我们经常会遇到一些错误提示&#xff0c;其中之一就是“msvcp120.dll丢失”。这个错误通常会导致某些应用程序无法正常运行&#xff0c;给用户带来很大的困扰。那么&#xff0c;如何解决msvcp120.dll丢失的问题呢&#xff1f;本文将为大家介绍…

xml schema中的sequence的含义

https://www.w3.org/TR/xmlschema-1/#element-sequence xml schema中的sequence的含义&#xff1a;包含的元素必须按规定的顺序出现。通过属性maxOccurs和minOccurs可以定义最多、最少出现的次数。最多可以定义不限制次数&#xff0c;最少可以定义0次。默认是最少出现1次&…

pyTorch Hub 系列#4:PGAN — GAN 模型

一、主题描述 2014 年生成对抗网络的诞生及其对任意数据分布进行有效建模的能力席卷了计算机视觉界。两人范例的简单性和推理时令人惊讶的快速样本生成是使 GAN 成为现实世界中实际应用的理想选择的两个主要因素。 然而&#xff0c;在它们出现后的很长一段时间内&#xff0c;GA…

02:2440---时钟体系

目录 一:时钟控制 1:基本概念 2:时钟结构图 3:结构图分析 4:总线 5:寄存器 A:FCLK--MPLLCON B:HCLK和PCLK--CLKDIVN C:注意 二:上电复位 1:上电复位 2:时钟选择 三:代码 一:时钟控制 1:基本概念 S3C2440A中的时钟控制逻辑可以产生所需的时钟信号&#xff0c;包括C…

node插件express(路由)的插件使用(二)——cookie 和 session的基本使用区别

文章目录 前言一、express 框架中的 cookie0、cookie的介绍和作用1. 设置cookie2.删除cookie3.获取cookie&#xff08;1&#xff09;安装cookie-parser&#xff08;2&#xff09;导入cookie-parser&#xff08;3&#xff09;注册中间件&#xff08;4&#xff09;获取cookie&…

类和对象(3):拷贝构造函数

引入&#xff1a; class Stack { public:Stack(int capacity 3){_a (int*)malloc(sizeof(int) * capacity);if (nullptr _a){perror("malloc");exit(-1);}_top 0;_capacity capacity;}~Stack(){free(_a);_top _capacity 0;_a nullptr;}private:int* _a;int _…

终止进程,GPU显存仍被占用 | kill -9彻底杀死进程

问题描述&#xff1a;在Linux终端把进程终止后&#xff0c;发现显存没有被释放出来&#xff01; 显示所有进程 ps aux|grep python杀死单个进程 kill -9 PID杀死多个进程 kill -9 PID PID PID...结果如下&#xff0c;显存已经被释放出来了&#xff01;