您的位置:首页 > 其它

使用hash法高效替换多个字符

2017-05-28 18:32 190 查看
在项目中经常要遇到要对字符串中的特殊的字符进行替换,例如字符串中如果多了个回车键、换行符或是制表符,那么将该string写成行表形式的数据时,该行数据将不能满足需求。而如果替换过程中,不注意算法的设计,替换的时间复杂度将很高。本文介绍使用hash的方式,以空间的浪费的代价来换取替换时间的降低,使得时间复杂度达到O(N).

假设待替换的字符为\t,\r,\n,要将他们替换为*。方法是,将待替换的字符映射到hash中(以vector实现,vector下标为字符的ASCII码)。替换时,遍历字符串的每个字符,以hash的方式判断该字符是否在待替换的字符表中。

此次还用到一个特性,就是 char ch = 9;与 char ch = ‘\t’;定义效果一样。

示例代码

#include <iostream>
#include <string>
#include <vector>

using namespace std;

void hashRepalce(vector<int> vecChs,string &str)
{
int idx ;
for(size_t i = 0 ; i < str.length() ;++i)
{
//获取遍历字符的ASCii码
idx = str[i];
//注意 idx > 0  && idx < vecChs.size() 判断的必要性,如果不判断,那么对于汉字,或者其他字符,
//它们的ASCII码不在hash表的范围内,将导致内存访问越界
//vecChs[idx]即可判断该字符是否在hash的待替换字符之列
if(idx > 0  && idx < vecChs.size() && vecChs[idx])
{
str[i] = '*';
}
}
}

int main()
{
string str = "hello \t,world \n";
vector<int> vec;
//初始化vector,大小为256,初始值为0
vec.resize(256,0);
//将要替换的字符的下标对于的vector值置为1
vec[9] = 1 ; // \t
vec[10] = 1 ; // \n
vec[13] = 1 ; // \r
hashRepalce(vec,str);
cout<<str<<endl;
return 0;
}
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: