php中文字符截取的三种方案(转自橡树眼)
2010-08-20 15:36
169 查看
字符是一个很烦人而难以解决的问题,下面收集几个PHP对中文截取的代码:
1、按字数截取UTF8字符
/**
* @abstract 按字数截取UTF8字符
*/
function utf8_substr($str, $start, $length) {
if (function_exists('mb_substr')) {
return mb_substr($str, $start, $length, 'UTF-8');
}
preg_match_all("/./u", $str, $arr);
return implode("", array_slice($arr[0], $start, $length));
}
2、支持gb2312,gbk,utf-8,big5 中文截取
/*
* 中文截取,支持gb2312,gbk,utf-8,big5
*
* @param string $str 要截取的字串
* @param int $start 截取起始位置
* @param int $length 截取长度
* @param string $charset utf-8|gb2312|gbk|big5 编码
* @param $suffix 是否加尾缀
*/
public function csubstr($str, $start=0, $length, $charset="utf-8", $suffix=true){
if(function_exists("mb_substr")){
if(mb_strlen($str, $charset) <= $length) return $str;
$slice = mb_substr($str, $start, $length, $charset);
}else {
$re['utf-8'] = "/[/x01-/x7f]|[/xc2-/xdf][/x80-/xbf]|[/xe0-/xef][/x80-/xbf]|[/xf0-/xff][/x80-/xbf]/";
$re['gb2312'] = "/[/x01-/x7f]|[/xb0-/xf7][/xa0-/xfe]/";
$re['gbk'] = "/[/x01-/x7f]|[/x81-/xfe][/x40-/xfe]/";
$re['big5'] = "/[/x01-/x7f]|[/x81-/xfe]([/x40-/x7e]|/xa1-/xfe])/";
preg_match_all($re[$charset], $str, $match);
if(count($match[0]) <= $length) return $str;
$slice = join("",array_slice($match[0], $start, $length));
}
if($suffix) return $slice."…";
return $slice;
}
这两个是比较不错的函数,下面这个以类的思想来做,仅供参考,不做多评...代码如下:
3、类实现方法
![](http://image.webstory.my/WebStoryLogo20.png)
这就是菊子曰啦!
1、按字数截取UTF8字符
/**
* @abstract 按字数截取UTF8字符
*/
function utf8_substr($str, $start, $length) {
if (function_exists('mb_substr')) {
return mb_substr($str, $start, $length, 'UTF-8');
}
preg_match_all("/./u", $str, $arr);
return implode("", array_slice($arr[0], $start, $length));
}
2、支持gb2312,gbk,utf-8,big5 中文截取
/*
* 中文截取,支持gb2312,gbk,utf-8,big5
*
* @param string $str 要截取的字串
* @param int $start 截取起始位置
* @param int $length 截取长度
* @param string $charset utf-8|gb2312|gbk|big5 编码
* @param $suffix 是否加尾缀
*/
public function csubstr($str, $start=0, $length, $charset="utf-8", $suffix=true){
if(function_exists("mb_substr")){
if(mb_strlen($str, $charset) <= $length) return $str;
$slice = mb_substr($str, $start, $length, $charset);
}else {
$re['utf-8'] = "/[/x01-/x7f]|[/xc2-/xdf][/x80-/xbf]|[/xe0-/xef][/x80-/xbf]|[/xf0-/xff][/x80-/xbf]/";
$re['gb2312'] = "/[/x01-/x7f]|[/xb0-/xf7][/xa0-/xfe]/";
$re['gbk'] = "/[/x01-/x7f]|[/x81-/xfe][/x40-/xfe]/";
$re['big5'] = "/[/x01-/x7f]|[/x81-/xfe]([/x40-/x7e]|/xa1-/xfe])/";
preg_match_all($re[$charset], $str, $match);
if(count($match[0]) <= $length) return $str;
$slice = join("",array_slice($match[0], $start, $length));
}
if($suffix) return $slice."…";
return $slice;
}
这两个是比较不错的函数,下面这个以类的思想来做,仅供参考,不做多评...代码如下:
3、类实现方法
![](http://image.webstory.my/WebStoryLogo20.png)
这就是菊子曰啦!
相关文章推荐
- PHP中文字符截取方案(UTF8,GB编码截取)
- PHP 字符截取 解决中文的截取问题,不用mb系列
- php中文字符截取防乱码
- php 中文字符截取函数
- 自己在用的PHP中文字符截取函数
- php截取中文字符,去html标记,count用法
- php去除html标签并截取中文字符
- php实现中文字符截取防乱码方法汇总
- php实现中文字串截取无乱码的三种方法(详)
- PHP 截取中文字符函数
- PHP字符截取函数。兼容中文,英文,中英文混杂等情况
- PHP截取中文字符出现乱码的具体解决办法
- php中文字符截取防乱码
- PHP substr截取中文字符出现…
- PHP substr截取中文字符出现乱码的问题解疑
- PHP截取中文字符无乱码 mb_substr()
- PHP截取字符串,获取长度,获取字符位置的函数 中文字符截取
- PHP substr截取中文字符出现乱码的具体解决办法
- php smarty截取中文字符乱码问题?gb2312/utf-8