您的位置：首页 > 其它

“Parameter estimation for text analysis ”翻译

2017-09-18 01:31 162 查看

《Parameter estimation for text analysis 》翻译（待完善）

最近因为需要了解LDA文章，阅读了《LDA数学八卦》，里面提到了这篇文章，感觉翻译一遍会理解得更透彻，但是文字功底不好，只能作粗浅的表述，欢迎指正建议~

摘要：这篇文章展示利用离散概率分布的参数估计方法，跟文本建模非常相关。从极大似然开始，还会有贝叶斯后验估计，中心概念，如共轭分布，贝叶斯网络的先导内容。通过完整的近似推理算法的推导，详细解释LDA模型，这个近似推理算法基于Gibbs抽样，最后讨论Dirichlet超参数估计。

文本分析中的参数估计

原作者：Gregor Heinrich

简介

这篇技术讲义旨在通过回顾离散域的贝叶斯参数估计的基础内容，帮助理解基于主题的文本分析方法的内部原理，例如PLSA,LDA，计数数据的混合模型。尽管这部分基础内容在学术界被视为普遍常识，但是没有通俗的书籍或者介绍性的文章填充这样的角色：大部分一直的文本使用高斯域的例子，里面的表达并不常见。其他对于主题模型的介绍工作出于简洁性的考虑，忽略了算法的细节还有其他背景。

因此我们将在第二节利用二进制数据的一些简单例子，系统地解释参数估计的基本概念。然后我们将在第三节介绍文本领域所需的最常见的概率分布以及共轭的概念。相关的现实世界的共轭对的联合共轭性直接证明了所选分布的正确性。第四节将介绍贝叶斯网络，作为一种图形化语言通过概率模型描述系统。

有了前面的基础概念，我们在第五节阐述LDA的概念，这个模型能灵活估计文本属性。以LDA为示例，描述在贝叶斯网络中作为近似推理的方法，Gibbs抽样。然后讨论LDA的两个重要内容：第六节讨论LDA超参数的影响和估计方法，第七节分析LDA模型的查询和估计

参数估计方法

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航