friso-1.6.1 发布 - C语言高性能中文分词器-检测模式切分
2014-07-23 10:47
309 查看
Friso是使用c语言开发的一款开源中文分词器,使用流行的mmseg算法实现。完全基于模块化设计和实现,可以很方便的植入其他程序中,例如:MySQL,PHP,源码无需修改就能在各种平台下编译使用,同时支持对UTF-8/GBK编码的切分.
friso-1.6.1:
1. friso.ini中friso.lex_dir增加相对friso.ini的路径支持,这个可以让嵌入部署更方便。
2. 修复两处内存泄漏bug。 (无名英雄找到的,在此感谢)
3. 改善中英混合词的识别, 可以识别更多情况,
例如:高3。
4. 词库优化, 加入了一些新词条。
5. 修复friso_dic_add &
array_list_insert的两处代码bug。
6. 增加检测模式切分, 只返回词库中有的词条,这个对于有些需求确实挺有用的。
7. 集成了php扩展绑定,完美支持PHP分词。以前这个是单独拿出来的,并且项目为robbe,为了方便管理,现在统一绑定到了friso项目里面。
friso从下个版本开始,会逐渐去提供sphinx的token
filter,socket接口等。
google
code不在提供下载,下载地址:
1. git@osc 附件:http://git.oschina.net/lionsoul/friso/attach_files
2. friso SF: https://sourceforge.net/projects/friso/files/
感谢广大网友的支持和反馈,祝大家工作愉快。
friso-1.6.1:
1. friso.ini中friso.lex_dir增加相对friso.ini的路径支持,这个可以让嵌入部署更方便。
2. 修复两处内存泄漏bug。 (无名英雄找到的,在此感谢)
3. 改善中英混合词的识别, 可以识别更多情况,
例如:高3。
4. 词库优化, 加入了一些新词条。
5. 修复friso_dic_add &
array_list_insert的两处代码bug。
6. 增加检测模式切分, 只返回词库中有的词条,这个对于有些需求确实挺有用的。
7. 集成了php扩展绑定,完美支持PHP分词。以前这个是单独拿出来的,并且项目为robbe,为了方便管理,现在统一绑定到了friso项目里面。
friso从下个版本开始,会逐渐去提供sphinx的token
filter,socket接口等。
code不在提供下载,下载地址:
1. git@osc 附件:http://git.oschina.net/lionsoul/friso/attach_files
2. friso SF: https://sourceforge.net/projects/friso/files/
感谢广大网友的支持和反馈,祝大家工作愉快。
相关文章推荐
- Friso-1.6.0 发布 - C语言高性能中文分词器,GBK支持
- jcseg-1.9.4 发布 - Java轻量级开源中文分词器-检测模式切分
- 【ASP.NET 问题】IIS发布网站后出现“检测到在集成的托管管道模式下不适用的ASP.NET设置”的解决办法
- 如何用C语言中的union检测CPU的端模式
- 简述C语言中的存储模式(字节顺序)以及程序检测
- 23种设计模式 之 Observer模式(发布-订阅模式)[C语言]
- 发布一个高性能的Reactor模式的C++网络库:evpp
- IBatis.Net DataMapper 1.6.1 and DataAccess 1.9.1发布了
- 昨日关注:微软新发布的共享设计模式的WIKI
- IBatis.Net DataMapper 1.6.1 and DataAccess 1.9.1发布了
- Flex 发布模式
- 致力于数据切分的Amoeba for mysql 0.12版本发布
- 完成端口模式下的高性能网络服务器
- Flex 发布模式
- C源码:可以检测10 种C语言编译环境的程序
- states模式在C语言中的实践
- 08-02-19>pe_xscan 增加Windows启动模式和对SuperHidden值检测和报告
- 超强分页类2.0发布,支持自定义风格,默认4种显示模式
- 在3.0平台下检测手机离线及无声模式
- IBatis.Net DataMapper 1.6.1 and DataAccess 1.9.1发布了