jieba提取关键词时筛选词性时单词性选择的一点注意事项
2017-03-31 17:46
330 查看
最近又在迭代特征工程,发现jieba提取特征词有个需要注意的地方,直接看例子
allow_pos = (‘nr’,) 带逗号,allow_pos是tuple, 结果只选取’nr’词性的词
allow_pos = (‘nr’), allow_pos是一个string, 结果选取了’n’ 和’r’的词性
这个差别造成了关键词提取方法中词性选取的差异
例子1
>>> import jieba >>> import jieba.posseg as pseg >>> s = '我们喜欢支付宝, 苹果' >>> ws = pseg.cut(s) >>> for i in ws: ... print i ... 我们/r 喜欢/v 支付宝/nr ,/x /x 苹果/n >>> allow_pos = ('nr',) >>> tags = jieba.analyse.extract_tags(s, topK=10, withWeight=False, allowPOS=allow_pos) >>> for t in tags: ... print t ... 支付宝 >>> allow_pos = ('nr') >>> tags = jieba.analyse.extract_tags(s, topK=10, withWeight=False, allowPOS=allow_pos) >>> for t in tags: ... print t ... 苹果 我们
allow_pos = (‘nr’,) 带逗号,allow_pos是tuple, 结果只选取’nr’词性的词
allow_pos = (‘nr’), allow_pos是一个string, 结果选取了’n’ 和’r’的词性
这个差别造成了关键词提取方法中词性选取的差异
相关文章推荐
- NLP自然语言处理 jieba中文分词,关键词提取,词性标注,并行分词,起止位置,文本挖掘,NLP WordEmbedding的概念和实现
- jieba分词、关键词提取、词性标注
- 选择网站关键词的注意事项
- 选择好变量名的注意事项
- 选择短信验证码接口提供商注意事项
- 一点公益商城源码揭秘消费全返app定制注意事项
- ios后台长时间运行的选择策略及注意事项
- python jieba实现关键词提取
- 物体检测正负样本的选择注意事项
- 域名选择和注意事项
- jQuery 在Table中选择input之类的东西注意事项
- 表单提交前onclick使用reuturn时,ajax请求同步异步的一点注意事项
- 虚拟机上安装的Linux从Windows本机提取文件的几种方式及注意事项
- 编程新手选择开发语言的注意事项
- 如何取得Repeater控件选择的项目及注意事项
- mega169应用的一点注意事项!datasheet中没有提到的!
- 选择好变量名的注意事项
- jieba分词、自定义词典提取高频词、词性标注及获取词的位置
- c#中关于compare比较的一点注意事项
- Intent Filter中category&&Action一点注意事项