使用collapsed gibbs sampling对LDA中参数进行估计的推导过程
2015-03-21 21:49
357 查看
使用
来表示文档--主题分布
的超参数,使用
来表示主题--词汇分布
的超参数,这些超参数的先验分布被定义在一个狄利克莱分布中,如下所示:
在给定参数
的情况下,所有隐变量(主题)的概率被定义在一个多项式分布
中,其中
表示在文档m中,被赋给主题k的词汇数量。
在给定参数
的情况下,所有可观测变量(单词)的概率和所有的隐变量被定义在一个多项式分布
中,其中
表示语料库中单词v被赋予主题z的次数。
注意,在以上两个公式中,我们假设在给定参数的情况下,所有变量均独立于超参数。
在给定超参数的情况下,所有变量(包括参数)的联合分布被定义如下:
在获取这个联合概率后,我们准备积分掉所有的参数:
最终所得内容使用了公式8(也即公式9上面的推导内容)的结果,同时也使用了gamma公式的一个重要性质:
来表示文档--主题分布
的超参数,使用
来表示主题--词汇分布
的超参数,这些超参数的先验分布被定义在一个狄利克莱分布中,如下所示:
在给定参数
的情况下,所有隐变量(主题)的概率被定义在一个多项式分布
中,其中
表示在文档m中,被赋给主题k的词汇数量。
在给定参数
的情况下,所有可观测变量(单词)的概率和所有的隐变量被定义在一个多项式分布
中,其中
表示语料库中单词v被赋予主题z的次数。
注意,在以上两个公式中,我们假设在给定参数的情况下,所有变量均独立于超参数。
在给定超参数的情况下,所有变量(包括参数)的联合分布被定义如下:
在获取这个联合概率后,我们准备积分掉所有的参数:
最终所得内容使用了公式8(也即公式9上面的推导内容)的结果,同时也使用了gamma公式的一个重要性质:
相关文章推荐
- 关于JDBC使用命名参数(named parameters)进行存储过程调用的问题
- oracle的存储过程中使用变量或参数进行模糊查询(like的变量绑定)
- 让存储过程中的查询语句按照不同查询条件进行优化(即每次查询都使用参数option(recompile))
- 使用MATLAB BNT贝叶斯工具箱,进行Gibbs Sampling之前需要做的编译工作
- 使用MATLAB贝叶斯工具箱(BNT),进行吉布斯采样(Gibbs Sampling)之前需要做的编译工作
- 在今天的测试过程中,我刚开始使用get方法传递参数,出现乱码,但是使用post传参数好着的,需要在tomcat的server.xml里面进行设置URIEncoding="UTF-8"即可
- 使用WebView进行postUrl请求发送参数过程中数据丢失或错误的问题。
- 使用极大似然法对逻辑回归中的参数进行估计的数学原理
- LDA主题模型简介-&&-浅谈gibbs sampling(LDA实验)
- LDA-math-MCMC 和 Gibbs Sampling
- 存储过程使用 in 添加多个参数的情况处理方式【转】
- Jmeter使用嵌套循环实现读取2个文件的参数来进行组合参数化
- 使用参数化SQL语句进行模糊查找(转载)
- 使用nginx进行ab站点的过程简单分析
- tensorflow保存网络参数 使用训练好的网络参数进行数据的预测
- 在C#中使用EntityFramework(EF)生成实体进行存储过程的调用
- 两种使用nuzt接收动态参数编写SQL语句进行分页查询
- 使用积分图进行法线估计
- 使用CAD看图软件来进行CAD转换PDF的过程
- Oracle 使用IN参数创建/调用存储过程