截取包含多字节字符的字符串
2005-04-04 14:21
344 查看
自己写的一个函数。
如果字符串中含有中文,简单截取会出现乱码,简单的做法是,把它先转换成宽字符然后截取,完成后再转回来。当然,对于本身是Unicode的程序,直接截取就行了,不必转换。
///////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////
BOOL TruncStringLeft(LPTSTR lpszSource, int nCnt)
{
ATLASSERT(lpszSource);
if(NULL == lpszSource || nCnt <1 || !lpszSource[0])
return FALSE;
WCHAR wszWide[MAX_PATH * 2];
#ifdef UNICODE
_tcscpy(wszWide, lpszSource);
#else
MultiByteToWideChar(CP_ACP, 0, lpszSource, -1, wszWide, ARRAYSIZE(wszWide));
#endif
if(wcslen(wszWide)>nCnt)
wszWide[nCnt] = 0;
#ifdef UNICODE
_tcscpy(lpszSource, wszWide);
#else
WideCharToMultiByte(CP_ACP, 0, wszWide, -1, lpszSource, MAX_PATH, NULL, NULL);
#endif
return TRUE;
}
///////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////
一些相关的讨论:
http://dev.csdn.net/develop/article/66/66387.shtm
http://community.csdn.net/Expert/topic/3906/3906053.xml?temp=.4827692
如果字符串中含有中文,简单截取会出现乱码,简单的做法是,把它先转换成宽字符然后截取,完成后再转回来。当然,对于本身是Unicode的程序,直接截取就行了,不必转换。
///////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////
BOOL TruncStringLeft(LPTSTR lpszSource, int nCnt)
{
ATLASSERT(lpszSource);
if(NULL == lpszSource || nCnt <1 || !lpszSource[0])
return FALSE;
WCHAR wszWide[MAX_PATH * 2];
#ifdef UNICODE
_tcscpy(wszWide, lpszSource);
#else
MultiByteToWideChar(CP_ACP, 0, lpszSource, -1, wszWide, ARRAYSIZE(wszWide));
#endif
if(wcslen(wszWide)>nCnt)
wszWide[nCnt] = 0;
#ifdef UNICODE
_tcscpy(lpszSource, wszWide);
#else
WideCharToMultiByte(CP_ACP, 0, wszWide, -1, lpszSource, MAX_PATH, NULL, NULL);
#endif
return TRUE;
}
///////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////
一些相关的讨论:
http://dev.csdn.net/develop/article/66/66387.shtm
http://community.csdn.net/Expert/topic/3906/3906053.xml?temp=.4827692
相关文章推荐
- 从一个包含汉字和其他字符的字符串中截取指定字节长度的字符串,不可以出现中文乱码
- C#、Java实现按字节截取字符串包含中文汉字和英文字符数字标点符号等
- 截取包含多字节字符的字符串
- 字符串按字节的高级截取(字符中有汉字)
- java 截取一个包含汉字的字符串的前n个字节的算法
- 截取字符串 包含中文处理,一个中文字符等于2个长度
- 包含中文的字符串中截取前N个字符
- 获取包含中文,字母,数字集合的字符串的长度(1个汉字字符存储需要2个字节,1个英文字符存储需要1个字节)
- 从给定字符串中截取n个字节的字符(解决汉字截取乱码问题)
- jquery 多维数组实现PHP的count、in_array(不区分大小写),utf8字符串(包含中文,中文字符2个字节)字节统计
- js中字符串处理常用的方法(字符分割、字符拼接、截取字符串、是否包含一个字符串)
- 设计函数,输入为一个字符串,里边包含中文、英文、数字等字符,编码为GBK。中文字符的编码规则假定为:双字节组成,高字节大于0x80,低字节任意。
- 求中英文混合字符串长度,中英文混合字符串截取(汉字2个字节,字母数字等1个字节),字符转ASCII码,ASCII码转字符
- 给定一个字符串,包含中文字符和英文字符,取给定大小字节的子串。
- 给定一个字符串,包含中文字符和英文字符,取给定大小字节的子串。
- 输入字符串和字节数,截取子串(串中含有中文字符)
- 判断一个字符串包含某个字符/截取指定字符窜
- Object-c 中截取包含(中、英文、表情符号emojiicon)混合字符串的每个字符并获取此字符的unicode值
- 截取字符串,只截取前N个字节的字符
- 生成二维码 加密解密类 TABLE转换成实体、TABLE转换成实体集合(可转换成对象和值类型) COOKIE帮助类 数据类型转换 截取字符串 根据IP获取地点 生成随机字符 UNIX时间转换为DATETIME\DATETIME转换为UNIXTIME 是否包含中文 生成秘钥方式之一 计算某一年 某一周 的起始时间和结束时间