游戏开发敏感词屏蔽的功能实现
2016-07-20 21:00
337 查看
最近在申请版署,然后应各种外部不可言明的原因,需要处理下聊天里边的敏感词,本想着去找找有没成熟的算法,或许是没仔细搜索的原因,看了几个算法,都不很好,打算自己实现,思路如下:
1.敏感关键字的搜索字库结构 { {X} = {XX,XXX, ...} {坏} = {坏1,坏2,坏3, ...}, {黑} = {黑3,黑2,黑1, ...}, ... } 2.搜索算法过程 检测串 A = "黑XX好 XA 好 XXX 黑1" (1)拆分检测串 先将检测串拆分为数组,拆分标准为中文拆为单字,空格标点符号都作为分割列。 拆分后如 {黑,XX,好,XA,XXX,黑1} (2)索检序列串 遍历 [拆分好的组] 如果 [检测字符] : 存在[屏蔽词字库]中 遍历 : [屏蔽词词组] =>[检测字符] 是英文 判断 [检测字符] 与 [检测字符] =>[检测字符] 是中文 组装 [比较字符] : 长度=[检测字符],起始=[检测字符] 判断 [比较字符] 与 [检测字符]
相关文章推荐
- neural-networks-and-deep-learning expand_mnist.py
- 心路历程
- 迪杰斯特拉算法
- java中对ArrayList进行排序
- HDU1200 POJ2039 ZOJ2208 UVALive3084 To and Fro【密码+水题】
- 设计模式--大纲
- Java-File class
- 网络层协议-ICMP协议
- jQuery Mobile 可折叠块
- 【题】【树(树的直径&LCA)】NKOJ 2044 奶牛政坛 【RMQ&LCA】
- matlab中uint8,double,im2uint8,im2double的区别
- 2016暑期集训2——数论(知识点,模板,简单题题解)
- hdu 1062(DFS||dijkstra)
- linux 命令(3)echo
- Java-Map
- CCNA系列五之Trunk
- UVA-10499 The Land of Justice
- 基础命令使用
- HDU4846->区间DP
- iOS数据库操作(基于C语言API)