您的位置:首页 > 其它

[LeetCode P72] 编辑距离Levenshtein Distance算法[经典动态规划]

2017-08-25 10:54 344 查看
突然就写到72题了…中间也遇到了一些难题,60~70的题目有好几题坑题,不过Unique Path里有一题挺不错的,我想用迷宫回溯的方法求解,发现时间越界,其实也是用DP,有空放上来。

原题:

Given two words word1 and word2, find the minimum number of steps required to convert word1 to word2. (each operation is counted as 1 step.)

You have the following 3 operations permitted on a word:

a) Insert a character
b) Delete a character
c) Replace a character


解题思路:

注释解释的比较清楚,利用Levenshtein Distance求编辑距离,在我的分布式BayesWipe系统里也用了Levenshtein距离来判断两个tuple的相似性,在数据清洗、相似性度量方面性能还是比较出色的。

// Levenshtein Distance算法
// 动态规划求解,好像涉及到字符串的算法题都可以用dp[i][j]来求解
// s1 = x1...xka -> s2 = y1...ykb这样的东西:
// s1->s2的时候:
//      1. 如果a被删除,那么dp[i][j] = dp[i-1][j] + 1,因为a被删除耗费了一步操作
//          剩下的操作和dp[i-1][j]一样
//      2. 如果a没被删除,那么分两种情况讨论
//          (1) 如果b被删除,那么dp[i][j] = dp[i][j-1] + 1,因为b被删除耗费了一步操作,
//              剩下的操作和dp[i][j-1]一样(而且不用管a是不是被替换的,dp[i][j-1]已经告诉我们怎么选择)
//          (2) 如果b没被删除,说明两个字符串的末尾,一个是a,一个是b,如果a=b,那么这一步不需要操作,如
//              果a!=b,那么a要被替换,耗费1个操作,所以dp[i][j] = dp[i-1][j-1] + (a!=b?1:0)
class Solution {
public:
int minDistance(string word1, string word2) {
if (word1.length() == 0)
return word2.length();
else if (word2.length() == 0)
return word1.length();
vector<vector<int>> dp(word1.length()+1, vector<int>(word2.length()+1, 0));
for (int i = 1; i <= word1.length(); ++i)
dp[i][0] = i;
for (int i = 1; i <= word2.length(); ++i)
dp[0][i] = i;
// 初始化,空字符串需要add一些字符串才能变成其他字符串
for (int i = 1; i <= word1.length(); ++i)
{
for (int j = 1; j <= word2.length(); ++j)
{
dp[i][j] = min(dp[i-1][j-1] + (word1[i-1] != word2[j-1]),
min(dp[i-1][j], dp[i][j-1]) + 1);
// 按照Levenshtein算法求解
}
}
return dp[word1.length()][word2.length()];
}
};
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息