您的位置:首页 > 编程语言 > PHP开发

mrytsr PHP截取中文字符串,无乱码,基于正则

2015-01-03 21:35 344 查看
/**
* @brief strlen_mb 计算字符串长度,支持中文,自动检测编码,UTF-8与GBK测试通过
*
* @param $str
*
* @return
*/
function strlen_mb($str){
$mb_len = mb_detect_encoding($str) == 'UTF-8' ? 2 : 1;
$patt = '/([\x00-\x7f]|[\x80-\xff].{' . $mb_len . '})/';
$match = preg_match_all($patt, $str, $groups);
if($groups){
return count($groups[0]);
}else{
return false;
}
}

/**
* @brief substr_mb 截取字符串,中文防乱码,自动检测编码,UTF-8与GBK测试通过
*
* @param $str
* @param $start
* @param $len
*
* @return
*/
function substr_mb($str, $start, $len){
$mb_len = mb_detect_encoding($str) == 'UTF-8' ? 2 : 1;
$patt = '/([\x00-\x7f]|[\x80-\xff].{' . $mb_len . '}){' . $len . '}/';
preg_match($patt, $str, $groups);
if($groups){
return $groups[0];
}else{
return false;
}
}

echo '<meta charset=utf-8>';
$str = '北京dd欢迎你';
for($i = 0; $i <= strlen_mb($str); $i++){
var_dump(substr_mb($str, 0, $i));
}
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: