ANSJ词性标注集
2017-10-12 16:34
232 查看
注:该标注集与ICTCLAS2008汉语词性标注集几乎完全一致,不同之处仅在于名词中添加了一类
nr 人名
nr1 汉语姓氏
nr2 汉语名字
nrj 日语人名
nrf 音译人名
ns 地名
nsf 音译地名
nt 机构团体名
nz 其它专名
nl 名词性惯用语
ng 名词性语素
nw 新词
tg 时间词性语素
vd 副动词
vn 名动词
vshi 动词“是”
vyou 动词“有”
vf 趋向动词
vx 形式动词
vi 不及物动词(内动词)
vl 动词性惯用语
vg 动词性语素
ad 副形词
an 名形词
ag 形容词性语素
al 形容词性惯用语
bl 区别词性惯用语
rr 人称代词
rz 指示代词
rzt 时间指示代词
rzs 处所指示代词
rzv 谓词性指示代词
ry 疑问代词
ryt 时间疑问代词
rys 处所疑问代词
ryv 谓词性疑问代词
rg 代词性语素
mq 数量词
qv 动量词
qt 时量词
pba 介词“把”
pbei 介词“被”
cc 并列连词
uzhe 着
ule 了 喽
u
4000
guo 过
ude1 的 底
ude2 地
ude3 得
usuo 所
udeng 等 等等 云云
uyy 一样 一般 似的 般
udh 的话
uls 来讲 来说 而言 说来
uzhi 之
ulian 连 (“连小学生都会”)
xx 非语素字
xu 网址URL
wkz 左括号,全角:( 〔 [ { 《 【 〖〈 半角:( [ { <
wky 右括号,全角:) 〕 ] } 》 】 〗 〉 半角: ) ] { >
wyz 左引号,全角:“ ‘ 『
wyy 右引号,全角:” ’ 』
wj 句号,全角:。
ww 问号,全角:? 半角:?
wt 叹号,全角:! 半角:!
wd 逗号,全角:, 半角:,
wf 分号,全角:; 半角: ;
wn 顿号,全角:、
wm 冒号,全角:: 半角: :
ws 省略号,全角:…… …
wp 破折号,全角:—— -- ——- 半角:— —-
wb 百分号千分号,全角:% ‰ 半角:%
wh 单位符号,全角:¥ $ £ ° ℃ 半角:$
nw 新词
1. 名词 (1个一类,7个二类,5个三类)
n 名词nr 人名
nr1 汉语姓氏
nr2 汉语名字
nrj 日语人名
nrf 音译人名
ns 地名
nsf 音译地名
nt 机构团体名
nz 其它专名
nl 名词性惯用语
ng 名词性语素
nw 新词
2. 时间词(1个一类,1个二类)
t 时间词tg 时间词性语素
3. 处所词(1个一类)
s 处所词4. 方位词(1个一类)
f 方位词5. 动词(1个一类,9个二类)
v 动词vd 副动词
vn 名动词
vshi 动词“是”
vyou 动词“有”
vf 趋向动词
vx 形式动词
vi 不及物动词(内动词)
vl 动词性惯用语
vg 动词性语素
6. 形容词(1个一类,4个二类)
a 形容词ad 副形词
an 名形词
ag 形容词性语素
al 形容词性惯用语
7. 区别词(1个一类,2个二类)
b 区别词bl 区别词性惯用语
8. 状态词(1个一类)
z 状态词9. 代词(1个一类,4个二类,6个三类)
r 代词rr 人称代词
rz 指示代词
rzt 时间指示代词
rzs 处所指示代词
rzv 谓词性指示代词
ry 疑问代词
ryt 时间疑问代词
rys 处所疑问代词
ryv 谓词性疑问代词
rg 代词性语素
10. 数词(1个一类,1个二类)
m 数词mq 数量词
11. 量词(1个一类,2个二类)
q 量词qv 动量词
qt 时量词
12. 副词(1个一类)
d 副词13. 介词(1个一类,2个二类)
p 介词pba 介词“把”
pbei 介词“被”
14. 连词(1个一类,1个二类)
c 连词cc 并列连词
15. 助词(1个一类,15个二类)
u 助词uzhe 着
ule 了 喽
u
4000
guo 过
ude1 的 底
ude2 地
ude3 得
usuo 所
udeng 等 等等 云云
uyy 一样 一般 似的 般
udh 的话
uls 来讲 来说 而言 说来
uzhi 之
ulian 连 (“连小学生都会”)
16. 叹词(1个一类)
e 叹词17. 语气词(1个一类)
y 语气词(delete yg)18. 拟声词(1个一类)
o 拟声词19. 前缀(1个一类)
h 前缀20. 后缀(1个一类)
k 后缀21. 字符串(1个一类,2个二类)
x 字符串xx 非语素字
xu 网址URL
22. 标点符号(1个一类,16个二类)
w 标点符号wkz 左括号,全角:( 〔 [ { 《 【 〖〈 半角:( [ { <
wky 右括号,全角:) 〕 ] } 》 】 〗 〉 半角: ) ] { >
wyz 左引号,全角:“ ‘ 『
wyy 右引号,全角:” ’ 』
wj 句号,全角:。
ww 问号,全角:? 半角:?
wt 叹号,全角:! 半角:!
wd 逗号,全角:, 半角:,
wf 分号,全角:; 半角: ;
wn 顿号,全角:、
wm 冒号,全角:: 半角: :
ws 省略号,全角:…… …
wp 破折号,全角:—— -- ——- 半角:— —-
wb 百分号千分号,全角:% ‰ 半角:%
wh 单位符号,全角:¥ $ £ ° ℃ 半角:$
相关文章推荐
- ictclas,ansj,结巴分词,StanfordNLP中文分词以及所用词性标注集
- ictclas,ansj,结巴分词,StanfordNLP中文分词以及所用词性标注集
- Deep Learning 在中文分词和词性标注任务中的应用
- 基于隐马尔可夫模型的有监督词性标注
- 词性标注
- 基于隐马尔可夫模型的有监督词性标注
- 隐马学习二(从词性标注角度理解隐马尔可夫)
- Python 文本挖掘:jieba中文分词和词性标注
- jieba词性和句法分析树标注集
- nlp-形式语言与自动机-ch07-自动分词、命名实体识别与词性标注
- HMM模型用在词性标注、分词
- jieba分词/载入词典/抽取关键词/标注词性
- NLTK之词性标注
- 建立一个与词性标注问题相关联的HMM模型
- 中科院的分词系统使用的词性标注标准
- 分词:词性标注北大标准
- viterbi用于中文词性标注
- ICTCLAS 中科院分词系统 代码 注释 中文分词 词性标注
- 使用hmm建模实现词性标注实例
- 《统计自然语言处理基础》笔记(4)词性标注 之 作用和影响性能的主要因素