边界熵和边界多样性
2013-11-07 14:24
399 查看
在NLP任务中,特征是一个很重要的概念。在实际应用中,除一些常规的特征外,我们还经常会引入一些有用的额外特征,例如,进行命名实体识别(namedentityrecognition)任务时,可以提供一个这样的特征:指明一个字是否为常见中国姓氏。另外,也可以引入一些基于统计的量,例如边界熵(boundaryentropy),边界多样性(accessorvariety)等就常用于非监督型的中文分词模型,下面对这两个特征进行简要介绍。
相关文章推荐
- 输出无边界的空心字(代码)
- [B原创] Arm/x86结构体gcc内存边界对齐问题
- 跨越边界: Ajax on Rails
- 如何设置Excel单元格以某行或列为边界
- delphi 实现给字加边界代码
- 默多克新边界:网络为王的宏大图景
- BPM的边界界定
- [转]根据边界填充联通域
- 搜索引擎的权利边界
- TCP/IP通信程序设计的丰富多样性
- Arm结构体gcc内存边界对齐问题(zt)
- Delphi 正则表达式语法(5): 边界
- 共享的边界如何覆盖独享
- 数据结构内存边界对齐的三条原则
- TCP/IP通信程序设计的丰富多样性(长短连接、同步异步等)
- c#编程指南(十二) 平台调用P-INVOKE完全掌握, 结构体边界对齐和内存布局
- 结构体边界对齐
- TCP/IP通信程序设计的丰富多样性 (转)
- 有关TCP和UDP 粘包 消息保护边界
- [源码解读]Silverlight 4 中对不规则对象进行碰撞检测(在游戏中常使用的是否碰撞怪物边界等原理)