php preg_replace空格无法替换问题
2016-08-12 15:13
597 查看
一次坑爹的小bug。读取一段文字(编码utf-8),想替换掉空格,str_replace(" "..)、preg_replace("/\s/"..)都不起作用。
没办法,将替换不了的空格ord()下才看到,这个utf-8空格比较特殊。ASCII 194 + 160出来的。
问题的根源,在于UTF-8这种编码里面,存在一个特殊的字符,其编码是“0xC2 0xA0”(194 160),转换成字符的时候,表现为一个空格,跟一般的半角空格(ASCII 0x20)一样,唯一的不同是它的宽度不会被压缩,因此比较多的被用于网页排版(如首行缩进之类)。而其他的编码方式如GB2312、Unicode之类并没有这样的字符。
整理遇到的各种无法替换的字符:
chr(194).chr(160) 变现为空格
chr(227).chr(128) 变现为空格
chr(226).chr(128).chr(172).chr(226).chr(128).chr(172).chr(30) 变现为空
总结:替换不了的字符,打印出ASCII码来总能替换掉吧。
<?php $str = '<p> 你好<p>'; $str = preg_replace('/\s/is','',$c); $str = str_replace(" ", "a", $str); var_dump($str); //不起作用
没办法,将替换不了的空格ord()下才看到,这个utf-8空格比较特殊。ASCII 194 + 160出来的。
<?php $str = '<p> 你好<p>'; $str = str_replace(chr(194) . chr(160), "a", $str); // 解决方法1 $str = preg_replace('/\xC2\xA0/is', "a", $str); // 解决方法2 var_dump($str); //ok
问题的根源,在于UTF-8这种编码里面,存在一个特殊的字符,其编码是“0xC2 0xA0”(194 160),转换成字符的时候,表现为一个空格,跟一般的半角空格(ASCII 0x20)一样,唯一的不同是它的宽度不会被压缩,因此比较多的被用于网页排版(如首行缩进之类)。而其他的编码方式如GB2312、Unicode之类并没有这样的字符。
整理遇到的各种无法替换的字符:
chr(194).chr(160) 变现为空格
chr(227).chr(128) 变现为空格
chr(226).chr(128).chr(172).chr(226).chr(128).chr(172).chr(30) 变现为空
总结:替换不了的字符,打印出ASCII码来总能替换掉吧。
相关文章推荐
- php preg_replace空格无法替换问题
- PHP 字符串正则替换函数preg_replace使用说明
- PHP正则preg_replace()函数 Unknown modifier 'c'问题 _新手学php正则的时候遇到的问题
- php 空格无法替换,utf-8空格惹的祸
- 详解PHP正则表达式替换实现(PHP preg_replace,PHP preg_replace)
- 使用thinkphp和php中的问题-preg_replace(), 链式查询
- php preg_replace 乱码问题
- php中 用preg_replace替换config.php中的数组并赋值
- [PHP]利用preg_replace替换配置文件中的预定义项_构建过程
- 详解PHP正则表达式替换实现(PHP preg_replace,PHP preg_replace)
- PHP正则表达式替换函数preg_replace
- php preg_replace替换实例讲解
- php 使用 preg_replace 一次替换多个值
- 函数:PHP字符串正则替换函数preg_replace
- PHP正则替换preg_replace
- PHP preg_replace() 正则替换所有符合条件的字符串
- PHP preg_replace()正则替换字符串
- php preg_match_all结合str_replace替换内容中所有img
- sql server中字符串无法替换空格的问题