您的位置:首页 > 编程语言 > Python开发

《Python自然语言处理》学习笔记-第五章

2017-08-14 18:01 281 查看

第五章:分类和标注词汇

引入

①本章将介绍NLP中的一些基本技术,包括序列标注,N-gram模型、回退和评估。

②词性标注(简称标注):是将词汇按照它们的词性进行分类和标注的过程。

③词性也称为词类或者词汇范畴。

④用于特定任务的标记集合简称标记集。

5.1 使用词性标注器

①一个词性标注器处理一个词序列,为每个词附加一个词性标记。

②使用nltk的pos_tag方法,返回词和相应词性的元组构成的列表。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: