手把手教你做关键词匹配项目(搜索引擎)---- 第二十二天
2014-12-23 11:10
295 查看
最新面试经历:面试的感触(二)、面试的感触
最新的架构:高并发数据采集的架构应用(Redis的应用)
吐槽:今天也是刚把心态调整好,继续写以前没有完成的文章,最近几个月自己也是休整了一段时间,回家做苦力,也当作是锻炼锻炼自己的身体,毕竟任何东西都换不回你的健康,我也是建议做IT行业的帅哥们多活动活动你们其它的部位。
第二十二天
起点:手把手教你做关键词匹配项目(搜索引擎)---- 第一天
回顾:手把手教你做关键词匹配项目(搜索引擎)---- 第二十一天
小帅帅是乐于做总结的人,根据以前所学的知识他总结了如下:
1. 宝贝属性的扩展和类型的问题初步已经得到很好的控制了,不过要推广和运营维护还是遇到了很大的障碍。
2. 对关键词的拆分使用了scws扩展以及自己原生的业务拆词方案,拆词有效的解决了词组方面的匹配难度。
3. 所有的初始工作好像已经完成了,只需要最后的整理项目应该可以正式运行起来了。
小帅帅的主动意识比较强烈,他没有去问于老大,就自己动手写了份代码,该代码主要是为了把所有的步骤连接起来。
宝贝属性的扩展CharList的构建请参照:手把手教你做关键词匹配项目(搜索引擎)---- 第十二天 ~ 手把手教你做关键词匹配项目(搜索引擎)---- 第十八天
Selector主要步骤如下:
1. 获取宝贝属性。
2. 使用业务知识扩充宝贝属性,形成CharList
3. 从词库中获取关键词
4. 关键词拆分算法
5. 匹配度算法
6. 返回匹配上的关键词列表
代码如下:
测试驱动代码编程请参照:
也是使用一样的原理,先把测试代码写好,后续补全MatchExector代码。
MatchExector主要功能计算匹配度。
1. 如果只要有一个词在黑名单里面,匹配度肯定为零。
2. 如果是核心词,那么根据以前提到的算法来计算,请参照:手把手教你做关键词匹配项目(搜索引擎)---- 第十九天
整个代码相对来说实现了该有的功能,小帅帅非常的高兴,因为项目完成了肯定少不了项目奖金,说不定还有一餐丰富的晚餐,
想想都开始流口水了。
小帅帅把代码交给于老大,满怀期待的等候于老大的最后肯定。
于老大看了之后会有哪些反应呢?请关注第三章:关键词匹配项目深入研究(一)
第二章已完结,源代码地址:手把手教你做关键词匹配项目(二章完结篇)
最新的架构:高并发数据采集的架构应用(Redis的应用)
吐槽:今天也是刚把心态调整好,继续写以前没有完成的文章,最近几个月自己也是休整了一段时间,回家做苦力,也当作是锻炼锻炼自己的身体,毕竟任何东西都换不回你的健康,我也是建议做IT行业的帅哥们多活动活动你们其它的部位。
第二十二天
起点:手把手教你做关键词匹配项目(搜索引擎)---- 第一天
回顾:手把手教你做关键词匹配项目(搜索引擎)---- 第二十一天
小帅帅是乐于做总结的人,根据以前所学的知识他总结了如下:
1. 宝贝属性的扩展和类型的问题初步已经得到很好的控制了,不过要推广和运营维护还是遇到了很大的障碍。
2. 对关键词的拆分使用了scws扩展以及自己原生的业务拆词方案,拆词有效的解决了词组方面的匹配难度。
3. 所有的初始工作好像已经完成了,只需要最后的整理项目应该可以正式运行起来了。
小帅帅的主动意识比较强烈,他没有去问于老大,就自己动手写了份代码,该代码主要是为了把所有的步骤连接起来。
宝贝属性的扩展CharList的构建请参照:手把手教你做关键词匹配项目(搜索引擎)---- 第十二天 ~ 手把手教你做关键词匹配项目(搜索引擎)---- 第十八天
Selector主要步骤如下:
1. 获取宝贝属性。
2. 使用业务知识扩充宝贝属性,形成CharList
3. 从词库中获取关键词
4. 关键词拆分算法
5. 匹配度算法
6. 返回匹配上的关键词列表
代码如下:
<?php #@Filename:selector/Selector.php #@Author:oshine require_once dirname(__FILE__) . '/SelectorItem.php'; require_once dirname(__FILE__) . '/charlist/CharList.php'; require_once dirname(__FILE__) . '/charlist/CharlistHandle.php'; require_once dirname(dirname(__FILE__)) . '/lib/Logger.php'; class Selector { private static $charListHandle = array( "黑名单" => "BacklistCharListHandle", "近义词" => "LinklistCharListHandle" ); public static function select($num_iid) { $selectorItem = SelectorItem::createFromApi($num_iid); Logger::trace($selectorItem->props_name); $charlist = new CharList(); foreach (self::$charListHandle as $matchKey => $className) { $handle = self::createCharListHandle($className, $charlist, $selectorItem); $handle->exec(); } $selectWords = array(); $keywords = DB::makeArray("select word from keywords"); foreach ($keywords as $val) { # code... $keywordEntity = SplitterApp::split($val["word"]); # code... if(MacthExector::macth($keywordEntity,$charlist)){ $selectWords[] = $val["word"]; } } return $selectWords; } public static function createCharListHandle($className, $charlist, $selectorItem) { if (class_exists($className)) { return new $className($charlist, $selectorItem); } throw new Exception("class not exists", 0); } }
测试驱动代码编程请参照:
也是使用一样的原理,先把测试代码写好,后续补全MatchExector代码。
MatchExector主要功能计算匹配度。
1. 如果只要有一个词在黑名单里面,匹配度肯定为零。
2. 如果是核心词,那么根据以前提到的算法来计算,请参照:手把手教你做关键词匹配项目(搜索引擎)---- 第十九天
<?php #@Filename:mathes/MatchExector.php #@Author:oshine class MatchExector { public static function match(KeywordEntity $keywordEntity,CharList $charlist){ $matchingDegree = 0; $elementWords = $keywordEntity->getElementWords(); foreach ($elementWords as $word) { # code... if(in_array($word, $charlist->getBlacklist())) return false; if(in_array($word, $charlist->getCore())) $matchingDegree+=$keywordEntity->calculateWeight($word); } if($matchingDegree>0.8) return true; return false; } }
整个代码相对来说实现了该有的功能,小帅帅非常的高兴,因为项目完成了肯定少不了项目奖金,说不定还有一餐丰富的晚餐,
想想都开始流口水了。
小帅帅把代码交给于老大,满怀期待的等候于老大的最后肯定。
于老大看了之后会有哪些反应呢?请关注第三章:关键词匹配项目深入研究(一)
第二章已完结,源代码地址:手把手教你做关键词匹配项目(二章完结篇)
相关文章推荐
- 手把手教你做关键词匹配项目(搜索引擎)---- 第九天
- 手把手教你做关键词匹配项目(搜索引擎)---- 第十九天
- 手把手教你做关键词匹配项目(搜索引擎)---- 第十三天
- 手把手教你做关键词匹配项目(搜索引擎)---- 第十天
- 手把手教你做关键词匹配项目(搜索引擎)---- 第二十一天
- 手把手教你做关键词匹配项目(搜索引擎)---- 第十七天
- 手把手教你做关键词匹配项目(搜索引擎)---- 第十一天
- 手把手教你做关键词匹配项目(搜索引擎)---- 第二十天
- 手把手教你做关键词匹配项目(搜索引擎)---- 第十六天
- 手把手教你做关键词匹配项目(搜索引擎)---- 第十八天
- 手把手教你做关键词匹配项目(搜索引擎)---- 第十四天
- 手把手教你做关键词匹配项目(搜索引擎)---- 第十五天
- 手把手教你做关键词匹配项目(搜索引擎)---- 第十二天
- 手把手教你做关键词匹配项目
- 关键词匹配项目深入研究-过滤器的引入
- 手把手教你C#项目制作安装程序
- 人职双向匹配项目(2)--通用搜索技术
- c#项目,服务器错误:找不到具有绑定 NetTcpBinding 的终结点的与方案 net.tcp 匹配的基址
- Push Posting 关键词搜索职位 - 结合搜索引擎广告
- 搜索引擎对关键词作弊判断方法揭密