一个没有用了的函数,检测是否有重复段落。
2013-01-12 13:30
381 查看
一开始写这个函数还调试测试了很多次,但是结果还是差强人意。因为本来他的逻辑就是不对的,后来用了 similar_text替代。
功能:检测提交的文本是否有过度重复,段落对比!
其他:误伤率比较低,过滤功能不行。
/* 重复段落检测 */
public function hasRepeatLine($string)
{
$string = str_replace(array("\t"," ","@","#","。",",",".",","),'',$string);
//$string = str_replace("\r","\n",$string);
$lineArr = explode("\n",$string);
$countShort = $countMiddle = $countLong = 0;
$arr = array();
foreach($lineArr as $lineString)
{
$length = strlen( $lineString );
if($length < 1) continue;
if(in_array($lineString,$arr))
{
if($length < 13)
{
$countShort++;
if($countShort > 4) return true;//5次
} elseif($length>12 && $length < 51) {
$countMiddle++;
if($countMiddle > 3) return true; //4次
} elseif($length>50 && $length < 101) {
$countLong++;
if($countLong > 2) return true; //3次
} else {
return true;
}
}
$arr[] = $lineString;
}
return false;
}
功能:检测提交的文本是否有过度重复,段落对比!
其他:误伤率比较低,过滤功能不行。
/* 重复段落检测 */
public function hasRepeatLine($string)
{
$string = str_replace(array("\t"," ","@","#","。",",",".",","),'',$string);
//$string = str_replace("\r","\n",$string);
$lineArr = explode("\n",$string);
$countShort = $countMiddle = $countLong = 0;
$arr = array();
foreach($lineArr as $lineString)
{
$length = strlen( $lineString );
if($length < 1) continue;
if(in_array($lineString,$arr))
{
if($length < 13)
{
$countShort++;
if($countShort > 4) return true;//5次
} elseif($length>12 && $length < 51) {
$countMiddle++;
if($countMiddle > 3) return true; //4次
} elseif($length>50 && $length < 101) {
$countLong++;
if($countLong > 2) return true; //3次
} else {
return true;
}
}
$arr[] = $lineString;
}
return false;
}
相关文章推荐
- pthread_kill函数检测一个线程是否还活着的程序
- 实现一个算法来判断一个字符串中的字符是否唯一(即没有重复).不能使用额外的数据结构。 (即只使用基本的数据结构)
- 检测一个函数是否是JavaScript原生函数的小技巧
- 利用标志flag,设计一个函数,检测一个数是否为质数(素数)
- 写一个函数,检测输入的数字旋转180度后是否相等,比如619旋转后还是619.
- 一个检测数组元素是否均为空的函数
- 写一个服务,隔5分钟检测一次,某一个进程,是否启动,如果没有启动,则开启进程
- 检测一个函数是否是JavaScript原生函数的小技巧
- php中检测变量是否是一个对象的is_object函数介绍及用法举例
- JavaScript小技巧:如何检测一个函数是否是JavaScript原生函数
- asp下的一个检测链接是否正常的函数
- 快速检测一个字符数组中是否有重复的字符
- 如何压力测试一个唯一主键函数是否真的不会生成重复主键得方法
- asp下的一个检测链接是否正常的函数
- Python实遍历二维数组题目一:在一个二维数组中,每一行都按照从左到右递增的顺序排序,每一列都按照从上到下递增的顺序排序。请完成一个函数,输入这样的一个二维数组和一个整数,判断数组中是否含有该整数。
- Ajax技术之与服务器通信-一个完整的实例(实现检测用户名是否唯一功能)
- 使用python检测一个设备是否ping的通
- 定义一个函数,来实现重复代码的简写.
- alert7写的检测linux是否运行在VMWARE中的一个程序