编程之美——计算字符串的相似度
2010-05-10 14:37
369 查看
把两个字符串变成相同的基本操作定义如下:
1. 修改一个字符(如把 a 变成 b)
2. 增加一个字符 (如 abed 变成 abedd)
3. 删除一个字符(如 jackbllog 变成 jackblog)
针对于 jackbllog到jackblog 只需要删除一个或增加一个 l 就可以把两个字符串变为相同。把这种操作需要的次数定义为两个字符串的距离 L, 则相似度定义为1/(L+1) 即距离加一的倒数。那么jackbllog和jackblog的相似度为 1/1+1=1/2=0.5 也就是所两个字符串的相似度是 0.5,说明两个字符串已经很接近啦。
任意两个字符串的距离都是有限的,都
不会超过他们的长度之和,算法设计中我们并不在乎通过一系列的修改后,得到的两个相同字符串是什么样子。所以每次只需一步操作,并递归的进行下一计算。
获得两字符串之间距离为目的,我们可以用动态规划的方法思考问题。
边界 :当字符串A匹配完毕或者字符串B匹配完毕时
if (strAbegin > strAend)
{
if (strBbegin>strBend)
{
return 0;
}
else
{
return strBend - strBbegin + 1;
}
}
if (strBbegin > strBend)
{
if (strAbegin > strAend)
{
return 0;
}
else
{
return strAend - strAbegin + 1;
}
}
可能出现的情况 :
if (strA[strAbegin] == strB[strBbegin])//字符串A与B当前字符一样
{
return StraToStrb(strA, strAbegin + 1, strAend, strB, strBbegin + 1, strBend);
}
else
{
x = StraToStrb(strA, strAbegin + 1, strAend, strB, strBbegin + 1, strBend);
y = StraToStrb(strA, strAbegin, strAend, strB, strBbegin + 1, strBend);
z = StraToStrb(strA, strAbegin+1, strAend, strB, strBbegin, strBend);
return MiniNum(x, y, z) + 1;
}
全部代码:
private int MiniNum(int x,int y,int z)
{
int tempNum;
tempNum = x;
if (y < tempNum)
tempNum = y;
if (z<tempNum)
{
tempNum = z;
}
return tempNum;
}
public int StraToStrb(string strA, int strAbegin, int strAend, string strB, int strBbegin, int strBend)
{
//if(strA[strAlen] == strB[strBlen])
int x, y, z;
if (strAbegin > strAend)
{
if (strBbegin>strBend)
{
return 0;
}
else
{
return strBend - strBbegin + 1;
}
}
if (strBbegin > strBend)
{
if (strAbegin > strAend)
{
return 0;
}
else
{
return strAend - strAbegin + 1;
}
}
if (strA[strAbegin] == strB[strBbegin])
{
return StraToStrb(strA, strAbegin + 1, strAend, strB, strBbegin + 1, strBend);
}
else
{
x = StraToStrb(strA, strAbegin + 1, strAend, strB, strBbegin + 1, strBend);
y = StraToStrb(strA, strAbegin, strAend, strB, strBbegin + 1, strBend);
z = StraToStrb(strA, strAbegin+1, strAend, strB, strBbegin, strBend);
return MiniNum(x, y, z) + 1;
}
}
1. 修改一个字符(如把 a 变成 b)
2. 增加一个字符 (如 abed 变成 abedd)
3. 删除一个字符(如 jackbllog 变成 jackblog)
针对于 jackbllog到jackblog 只需要删除一个或增加一个 l 就可以把两个字符串变为相同。把这种操作需要的次数定义为两个字符串的距离 L, 则相似度定义为1/(L+1) 即距离加一的倒数。那么jackbllog和jackblog的相似度为 1/1+1=1/2=0.5 也就是所两个字符串的相似度是 0.5,说明两个字符串已经很接近啦。
任意两个字符串的距离都是有限的,都
不会超过他们的长度之和,算法设计中我们并不在乎通过一系列的修改后,得到的两个相同字符串是什么样子。所以每次只需一步操作,并递归的进行下一计算。
获得两字符串之间距离为目的,我们可以用动态规划的方法思考问题。
边界 :当字符串A匹配完毕或者字符串B匹配完毕时
if (strAbegin > strAend)
{
if (strBbegin>strBend)
{
return 0;
}
else
{
return strBend - strBbegin + 1;
}
}
if (strBbegin > strBend)
{
if (strAbegin > strAend)
{
return 0;
}
else
{
return strAend - strAbegin + 1;
}
}
可能出现的情况 :
if (strA[strAbegin] == strB[strBbegin])//字符串A与B当前字符一样
{
return StraToStrb(strA, strAbegin + 1, strAend, strB, strBbegin + 1, strBend);
}
else
{
x = StraToStrb(strA, strAbegin + 1, strAend, strB, strBbegin + 1, strBend);
y = StraToStrb(strA, strAbegin, strAend, strB, strBbegin + 1, strBend);
z = StraToStrb(strA, strAbegin+1, strAend, strB, strBbegin, strBend);
return MiniNum(x, y, z) + 1;
}
全部代码:
private int MiniNum(int x,int y,int z)
{
int tempNum;
tempNum = x;
if (y < tempNum)
tempNum = y;
if (z<tempNum)
{
tempNum = z;
}
return tempNum;
}
public int StraToStrb(string strA, int strAbegin, int strAend, string strB, int strBbegin, int strBend)
{
//if(strA[strAlen] == strB[strBlen])
int x, y, z;
if (strAbegin > strAend)
{
if (strBbegin>strBend)
{
return 0;
}
else
{
return strBend - strBbegin + 1;
}
}
if (strBbegin > strBend)
{
if (strAbegin > strAend)
{
return 0;
}
else
{
return strAend - strAbegin + 1;
}
}
if (strA[strAbegin] == strB[strBbegin])
{
return StraToStrb(strA, strAbegin + 1, strAend, strB, strBbegin + 1, strBend);
}
else
{
x = StraToStrb(strA, strAbegin + 1, strAend, strB, strBbegin + 1, strBend);
y = StraToStrb(strA, strAbegin, strAend, strB, strBbegin + 1, strBend);
z = StraToStrb(strA, strAbegin+1, strAend, strB, strBbegin, strBend);
return MiniNum(x, y, z) + 1;
}
}
相关文章推荐
- 编程之美3.3, 计算字符串的相似度
- 《编程之美》——计算字符串的相似度
- 计算字符串的相似度(编程之美)
- 《编程之美》读书笔记: 3.3 计算字符串的相似度
- 编程之美3.3 计算两个字符串的相似度
- 计算字符串的相似度(编程之美)
- 编程之美——计算字符串的相似度
- 编程之美3.3—计算字符串的相似度
- 计算字符串的相似度(编程之美3.3)
- 《编程之美》- 3.3 - 计算字符串相似度 即 最小编辑距离问题
- 编程之美3.3——计算字符串的相似度
- 编程之美:计算两个字符串的相似度---动态规划实现
- 《编程之美》 3.3 计算字符串的相似度
- 《编程之美》--计算字符串的相似度
- 编程之美---计算字符串的相似度
- 编程之美--计算字符串的相似度
- 《编程之美》读书笔记11: 3.3 计算字符串的相似度
- 编程之美3.3计算字符串的相似度
- 编程之美 3.3计算字符串的相似度
- 编程之美3.3——计算字符串的相似度