python学习笔记(一)jieba模块初探
2016-03-29 20:17
986 查看
环境说明:windows 7,python27,jieba VERSION 0.38,pycharm2016.1
1.简介:
支持中文分词,关键字提取,词性标注,自己管理词库等
2.安装:
方法一:开始->搜索cmd->cd到pip.exe目录->输入命令pip install jieba
3.代码片段:
import jieba
seg = jieba.cut('有关青春萌动',True/False)#分词,True/False 全模式/精确模式
seg = jieba.cut_for_search('有关青春萌动',True)#分词,搜索引擎模式
#seg 是迭代器,可通过list(seg)将其转换为列表
#关键词提取(import jieba.analyse)(sentence,关键词数目)
import jieba.analyse
seg = jieba.analyse.extract_tags('有关青春萌动',12)
print ' '.join(seg)
#词性标注
# import jieba.posseg as pseg
words = pseg.cut("我爱北京天安门")
for w in words:
print w.word,w.flag
1.简介:
支持中文分词,关键字提取,词性标注,自己管理词库等
2.安装:
方法一:开始->搜索cmd->cd到pip.exe目录->输入命令pip install jieba
3.代码片段:
import jieba
seg = jieba.cut('有关青春萌动',True/False)#分词,True/False 全模式/精确模式
seg = jieba.cut_for_search('有关青春萌动',True)#分词,搜索引擎模式
#seg 是迭代器,可通过list(seg)将其转换为列表
#关键词提取(import jieba.analyse)(sentence,关键词数目)
import jieba.analyse
seg = jieba.analyse.extract_tags('有关青春萌动',12)
print ' '.join(seg)
#词性标注
# import jieba.posseg as pseg
words = pseg.cut("我爱北京天安门")
for w in words:
print w.word,w.flag
相关文章推荐
- Python 并行计算
- 开源搜索引擎abelkhan
- python2.7:str
- 快速排序(python实现)
- Python初步学习(1)
- python_urllib2下载网页的三种方式
- Python获取豆瓣新书列表
- Python学习笔记(六)错误、调试和测试
- python正则表达式(关于re)
- 【python】dict。字典
- python连接MySQL源码
- python tuple 操作
- Python 实现简单的爬虫功能并保存到本地
- python re模块汇总
- python sproto支持64位有符号整数
- python之 sqlalchemy
- php crypt in python
- python--爬虫入门(七)urllib库初体验以及中文编码问题的探讨
- python基础
- 枚举法解决推理问题