您的位置:首页 > 编程语言 > Python开发

python学习笔记(一)jieba模块初探

2016-03-29 20:17 986 查看
环境说明:windows 7,python27,jieba VERSION 0.38,pycharm2016.1

1.简介:

 
支持中文分词,关键字提取,词性标注,自己管理词库等

2.安装:

方法一:开始->搜索cmd->cd到pip.exe目录->输入命令pip install jieba

3.代码片段:

import jieba

seg = jieba.cut('有关青春萌动',True/False)#分词,True/False  全模式/精确模式

seg = jieba.cut_for_search('有关青春萌动',True)#分词,搜索引擎模式

#seg 是迭代器,可通过list(seg)将其转换为列表

#关键词提取(import jieba.analyse)(sentence,关键词数目)

import jieba.analyse

seg  = jieba.analyse.extract_tags('有关青春萌动',12)

print ' '.join(seg)

#词性标注

# import jieba.posseg as pseg
words = pseg.cut("我爱北京天安门")
for w in words:

   print w.word,w.flag
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: