php 中字符串一样但长度不等的问题
2017-11-19 16:21
281 查看
问题:
如图所示 咋眼看去两个一样的中文字符串“后勤保障部”,但一个长度为21 一个为15。
首先直觉可能会认为是编码方式不一样导致的,
通过mb_detect_encoding()函数查看两个字符串的编码方式 代码如下
但输出结果都是UTF-8
那么是什么原因呢 ,我们在输出看下具体字符长度
输出结果如下:
发现字符串str1有7个中文字符,但实际只显示了5个,也就是“后勤保障部”
通过截取str1最后两个字符查看
无法echo显示,但确实占有两个字符
如果实际要求这看上去一样的字符串就相等的话,需要进行处理,处理就是剔除非中文字符:
最终代码如下
运行结果
注:
将21字节的str1复制到phpmyadmin的sql输入框,显示如下
如图所示 咋眼看去两个一样的中文字符串“后勤保障部”,但一个长度为21 一个为15。
首先直觉可能会认为是编码方式不一样导致的,
通过mb_detect_encoding()函数查看两个字符串的编码方式 代码如下
<?php header("Content-Type: text/html;charset=utf-8"); $data[0]=$str1="后勤保障部"; $data[1]=$str2="后勤保障部"; var_dump($data); //查看编码方式 $encode1 = mb_detect_encoding($str1, array("ASCII","UTF-8","GB2312","GBK","BIG5")); $encode2 = mb_detect_encoding($str2, array("ASCII","UTF-8","GB2312","GBK","BIG5")); echo "str1='".$str1."'"." 编码:".$encode1."</br>"; echo "str2='".$str2."'"." 编码:".$encode2."</br>"; ?>
但输出结果都是UTF-8
那么是什么原因呢 ,我们在输出看下具体字符长度
<?php header("Content-Type: text/html;charset=utf-8"); $data[0]=$str1="后勤保障部"; $data[1]=$str2="后勤保障部"; var_dump($data); //查看编码方式 $encode1 = mb_detect_encoding($str1, array("ASCII","UTF-8","GB2312","GBK","BIG5")); $encode2 = mb_detect_encoding($str2, array("ASCII","UTF-8","GB2312","GBK","BIG5")); //当mb_strlen的内码选择为UTF-8的时候,则会将中文字符当成一个字符 //strlen,得到的是字符串所占的字节数 echo "str1='".$str1."'".": 字符长度:".mb_strlen($str1).": 字节长度:".strlen($str1)." 编码:".$encode1."</br>"; echo "str2='".$str2."'".": 字符长度:".mb_strlen($str2).": 字节长度:".strlen($str2)." 编码:".$encode2."</br>"; ?>
输出结果如下:
发现字符串str1有7个中文字符,但实际只显示了5个,也就是“后勤保障部”
通过截取str1最后两个字符查看
//截取str1后面两个未显示字符 $res=mb_substr($str1, 5,2); echo "最后两字符:".$res."</br>"; echo mb_strlen($res);
无法echo显示,但确实占有两个字符
如果实际要求这看上去一样的字符串就相等的话,需要进行处理,处理就是剔除非中文字符:
//剔除str1字串中未显示的字符(非中文字符) preg_match_all('/[\x{4e00}-\x{9fff}]+/u', $str1, $matches); $str1 = join('', $matches[0]);
最终代码如下
<?php header("Content-Type: text/html;charset=utf-8"); $data[0]=$str1="后勤保障部"; $data[1]=$str2="后勤保障部"; var_dump($data); //查看编码方式 $encode1 = mb_detect_encoding($str1, array("ASCII","UTF-8","GB2312","GBK","BIG5")); $encode2 = mb_detect_encoding($str2, array("ASCII","UTF-8","GB2312","GBK","BIG5")); //当mb_strlen的内码选择为UTF-8的时候,则会将中文字符当成一个字符 //strlen,得到的是字符串所占的字节数 echo "str1='".$str1."'".": 字符长度:".mb_strlen($str1).": 字节长度:".strlen($str1)." 编码:".$encode1."</br>"; echo "str2='".$str2."'".": 字符长度:".mb_strlen($str2).": 字节长度:".strlen($str2)." 编码:".$encode2."</br>"; //截取str1后面两个未显示字符 echo "</br>------------------截取str1后面两个未显示字符---------------------</br>"; $res=mb_substr($str1, 5,2); echo "str1最后两字符: ".$res."</br>"; echo "str1长度: ".mb_strlen($res)."</br>"; //比较 echo "</br>--------------------------相等比较----------------------------------</br>"; echo "str1 与 str2比较: "; echo strcomp($str1,$str2)."</br>"; echo "str2 与 str2比较: "; echo strcomp($str2,$str2)."</br>"; //剔除str1字串中非中文 preg_match_all('/[\x{4e00}-\x{9fff}]+/u', $str1, $matches); $str1 = join('', $matches[0]); echo "</br>---------------------剔除str1字串中非中文后----------------------</br>"; echo "str1='".$str1."'".": 字符长度:".mb_strlen($str1).": 字节长度:".strlen($str1)." 编码:".$encode1."</br>"; echo "str1 与 str2比较: "; echo strcomp($str1,$str2)."</br>"; function strcomp($str1,$str2){ if($str1 == $str2){ return "相等"; }else{ return "不等"; } } ?>
运行结果
注:
将21字节的str1复制到phpmyadmin的sql输入框,显示如下
相关文章推荐
- PHP字符串变量的长度限制问题
- php验证字符串长度问题
- PHP 判断字符串长度及字符串切割问题
- 记一次js中和php中的字符串长度计算截取的终极问题和完美解决方案
- PHP中preg_match函数正则匹配的字符串长度问题
- preg_*匹配的字符串长度限制问题以及nginx,php上传文件过大问题
- PHP 判断字符串长度及字符串切割问题
- PHP中preg_match函数正则匹配的字符串长度问题
- 解决PHP字符串长度不一致的问题
- PHP的preg_match匹配字符串长度问题解决方法
- PHP的preg_match匹配字符串长度问题解决方法
- PHP 判断字符串长度及字符串切割问题
- PHP 判断字符串长度及字符串切割问题
- 记一次js中和php中的字符串长度计算截取的终极问题和完美解决方案
- 解决php中截取字符串的中文乱码问题
- php 不同编码下的字符串长度区分
- PHP计算字符串长度函数
- PHP简单有效的计算中英文字符串长度
- php获取字符串长度函数strlen和mb_strlen
- PHP计算中英混输字符串长度