您的位置：首页 > 其它

word2vec 中文训练小试牛刀

2015-02-09 00:36 260 查看

所用语料： 1998年人民日报语料，北京大学提供。

测试环境： Ubunt 14.10

下载好的语料已经是分好词的，把词性标注去掉就直接用作词向量的训练了。总大小 8.2 MB。

由于训练语料库的特殊性，算出来的 distance 很有意思，如下：

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航