题目描述
给定两个字符串A和B,现在要将A经过若干操作变为B,可进行的操作有:
删除–将字符串A中的某个字符删除。
插入–在字符串A的某个位置插入某个字符。
替换–将字符串A中的某个字符替换为另一个字符。
现在请你求出,将A变为B至少需要进行多少次操作。
输入格式
第一行包含整数n,表示字符串A的长度。
第二行包含一个长度为n的字符串A。
第三行包含整数m,表示字符串B的长度。
第四行包含一个长度为m的字符串B。
字符串中均只包含大写字母。
输出格式
输出一个整数,表示最少操作次数。
数据范围
1≤n,m≤1000
样例
10
AGTCTGACGC
11
AGTAAGTAGGC
输出样例:
4
算法(线性DP) $O(n^3)时间复杂度100万$
最短编辑距离的DP思考方式:
核心算法:考虑string a,b匹配的最后一步,分为三种操作分别考虑
(1)最后一步为删除操作,那么a的前i-1个字母和b的j个字母匹配(用j代表字符串b的所有字母)那么该情形的最小状态转移计算式f[i-1,j]+1.
(2)最后一步为增添操作,那么a的i个字母和b的j-1个字母匹配(用j代表字符串b的所有字母),那么该情形的最小状态转移计算式为f[i,j-1]+1.
(3)最后一步为替换操作,考虑俩种情形,替换当前位置的字母不同,那么a的前i-1个字母和b的前j-1个字母匹配(用j代表字符串b的所有字母)
那么该情形的最小状态转移计算式为f[i-1,j-1]+1,若当前位置的字母相同则不用替换;那么状态转移计算式为f[i-1,j-1].
(4)最后将三种操作的取min操作,即为最短编辑距离的状态转移计算式:f[i,j]=min(f[i-1][j]+1,f[i][j-1]+1,f[i-1][j-1]+1/0);
C++ 代码:
#include<bits/stdc++.h>
using namespace std;
const int N=1010;
int n,m;
char a[N],b[N];
int f[N][N];
int main(){
scanf("%d%s",&n,a+1); //防止状态计算式中的i-1,导致数组下标越界
scanf("%d%s",&m,b+1);
for(int i=0;i<=m;i++)f[0][i]=i;
//考虑a字符串为0来匹配字符串b的前i个字母时的情形,那么a字符串执行增添操作,增添的次数取决于b字符串字母的个数
for(int j=0;j<=n;j++)f[j][0]=j;
//考虑a字符串的前i个字母来匹配字符串b的0个字母的情形,那么a字符串执行删除操作,删除的次数取决于a字符串字母的个数
for(int i=1;i<=n;i++)
for(int j=1;j<=m;j++)
{
f[i][j]=min(f[i-1][j]+1,f[i][j-1]+1);
//前俩种情形的状态转移计算式,第三种情形需要判断当前位置是否相等
if(a[i]==b[j]) f[i][j]=min(f[i][j],f[i-1][j-1]);
else f[i][j]=min(f[i][j],f[i-1][j-1]+1);
}
printf("%d\n",f[n][m]);//表示把字符串a的前n个字母变为字符串b的前m个字母
return 0;
}
线性DP的思考方式
个人理解:大多都是考虑最后一步,然后利用此分类,归纳出状态转移方程。