您的位置:首页 > 其它

欢迎使用 HanLP

2016-05-05 09:12 239 查看
HanLP是由一系列模型与算法组成的Java工具包,目标是普及自然语言处理在生产环境中的应用。HanLP具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。 在提供丰富功能的同时,HanLP内部模块坚持低耦合、模型坚持惰性加载、服务坚持静态提供、词典坚持明文发布,使用非常方便,同时自带一些语料处理工具,帮助用户训练自己的语料。

入门指南

安装HanLP
快速上手

分词

调用分词器
动态创建和配置
线程安全性

词典

基本格式
数据结构
储存形式
修改方法

命名实体识别

中国人名识别
音译人名识别
日本人名识别
地名识别
机构名识别

篇章理解

关键词提取
自动摘要
短语提取

简繁拼音转换

简繁转换
拼音转换

依存句法解析

最大熵依存句法分析器
CRF依存句法分析器
输出格式

智能推荐

语义距离
智能推荐

Lucene插件

标准分词器
索引分词器
自定义分词器


其他文档功能

索引
模块索引
搜索页面

hanlp提供了中文分词,命名实体识别,摘要关键字,依存句法分析,简繁拼音转换,智能推荐的功能。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: