您的位置:首页 > 其它

边界熵和边界多样性

2013-11-07 14:24 399 查看
 

在NLP任务中,特征是一个很重要的概念。在实际应用中,除一些常规的特征外,我们还经常会引入一些有用的额外特征,例如,进行命名实体识别(namedentityrecognition)任务时,可以提供一个这样的特征:指明一个字是否为常见中国姓氏。另外,也可以引入一些基于统计的量,例如边界熵(boundaryentropy),边界多样性(accessorvariety)等就常用于非监督型的中文分词模型,下面对这两个特征进行简要介绍。




内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息