您的位置:首页 > 其它

测试CRF++训练出来的model

2017-01-06 10:33 204 查看
1.分析crf_model.txt
version: 100(版本号)

cost-factor: 1(默认为1,为了防止过拟合)

maxid: 50940

xsize: 1

这是文件的开头部分:
maxid:特征函数的最大id(因为中文采用的是BMES标注,所以实际结果)
xsize:特征维度(训练的语料库列数减去1)
2.对训练好的crf_model文件进行测试
crf_test -v1 -m crf_model test_word_tag.txt > result.txt
# 0.998863

他      B       S/0.999999

的      E       S/0.999999

提      B       B/0.999486

议      E       E/0.999435

没      B       B/0.999948

有      E       E/0.999997

得      B       B/0.999887

到      E       E/0.999887

什      B       B/0.999997

么      E       E/0.999923

结      B       B/0.999548

果      E       E/0.999624

。      S       S/0.999997

第一行:# 0.998863:
即是输出的条件概率,而且每一个输出tag各自含有一个概率,表示形式如“B/0.999486”。
crf_test -v2 -m crf_model test_word_tag.txt > result2.txt
# 0.998863

他      B       S/0.999999      B/0.000001      E/0.000000      M/0.000000      S/0.999999

的      E       S/0.999999      B/0.000000      E/0.000001      M/0.000000      S/0.999999

提      B       B/0.999486      B/0.999486      E/0.000000      M/0.000000      S/0.000514

议      E       E/0.999435      B/0.000001      E/0.999435      M/0.000051      S/0.000513

没      B       B/0.999948      B/0.999948      E/0.000000      M/0.000051      S/0.000000

有      E       E/0.999997      B/0.000000      E/0.999997      M/0.000003      S/0.000000

得      B       B/0.999887      B/0.999887      E/0.000000      M/0.000003      S/0.000110

到      E       E/0.999887      B/0.000000      E/0.999887      M/0.000002      S/0.000111

什      B       B/0.999997      B/0.999997      E/0.000000      M/0.000002      S/0.000000

么      E       E/0.999923      B/0.000000      E/0.999923      M/0.000076      S/0.000000

结      B       B/0.999548      B/0.999548      E/0.000000      M/0.000076      S/0.000376

果      E       E/0.999624      B/0.000000      E/0.999624      M/0.000000      S/0.000376

。      S       S/0.999997      B/0.000003      E/0.000000      M/0.000000      S/0.999997
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: