《Python自然语言处理》学习笔记-第五章
2017-08-14 18:01
281 查看
第五章:分类和标注词汇
引入①本章将介绍NLP中的一些基本技术,包括序列标注,N-gram模型、回退和评估。
②词性标注(简称标注):是将词汇按照它们的词性进行分类和标注的过程。
③词性也称为词类或者词汇范畴。
④用于特定任务的标记集合简称标记集。
5.1 使用词性标注器
①一个词性标注器处理一个词序列,为每个词附加一个词性标记。②使用nltk的pos_tag方法,返回词和相应词性的元组构成的列表。
相关文章推荐
- 《Python自然语言处理》学习笔记(三)
- 《计算机系统要素》学习笔记:第五章计算机体系结构
- 《Mongodb权威指南》学习笔记 第五章 索引
- python自然语言处理第五章
- 《Thinking in Java》学习笔记——第五章:隐藏实施过程
- 学习笔记《实战Linux Socket编程》第五章 为套接口绑定地址
- ASP.NET(VB.NET)学习笔记--第五章.ASP.NET的其他Web控件
- 《深入java虚拟机》学习笔记(第五章 java虚拟机)
- 《Mongodb权威指南》学习笔记 第五章 索引
- 《C++大学教程》学习笔记 第五章:控制语句(第二部分)
- 《Python自然语言处理》学习笔记(二)
- 《深入理解Android内核设计思想》学习笔记:第五章 Android进程、线程管理
- 《JavaScript高级程序设计》学习笔记(第五章)- 上
- 《COM原理及应用》学习笔记之第五章
- 《C++ Primer》学习笔记——第五章语句
- 《COM原理及应用》学习笔记之第五章
- 《android编程权威指南》学习笔记之第五章 第二个Activity
- 《Python自然语言处理》学习笔记-第二章
- 学习笔记--第五章神经网络
- 《Linux高性能服务器编程》学习笔记——第五章 Linux网络编程基础API(1)