您的位置:首页 > 其它

word2vec 中文训练小试牛刀

2015-02-09 00:36 260 查看

word2vec 中文训练小试牛刀

所用语料: 1998年人民日报语料,北京大学提供。

测试环境: Ubunt 14.10

下载好的语料已经是分好词的,把词性标注去掉就直接用作词向量的训练了。总大小 8.2 MB。

由于训练语料库的特殊性,算出来的 distance 很有意思,如下:













内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: