您的位置:首页 > 其它

使用TF-IDF进行文档分类

2014-04-02 11:05 239 查看
关于这个方法的原理比较的简单,可以参考:


1、TF-IDF与余弦相似性的应用(一):自动提取关键词


2、TF-IDF与余弦相似性的应用(二):找出相似文章

3、如何计算两个文档的相似度(一)

4、gensim做主题模型

5、当然还可以看看吴军博士的《数学之美》第十一章 如何确定网页和查询的相关性。

其中第4篇文章(gensim做主题模型)使用了python的gensim工具包做了关于使用TF-IDF、LDA和LSI的文档相似度比较。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: