指数分布与幂律分布定义及不同(泊松分布、伽马分布)
2016-07-18 17:18
1511 查看
1、定义
(1)幂律分布(pow law distribution),其概率密度函数形式如下,这种分布的共性是绝大多数事件的规模很小,而只有少数事件的规模相当大。y=cx-r
其中x,y是正的随机变量,c,r均为大于零的常数。
对上式两边取对数,可知lny与lnx满足线性关系lny=lnc-rlnx,也即在双对数坐标下,幂律分布表现为一条斜率为幂指数的负数的直线,这一线性关系是判断给定的实例中随机变量是否满足幂律的依据。判断两个随机变量是否满足线性关系,可以求解两者之间的相关系数;利用一元线性回归模型和最小二乘法,可得lny对lnx的经验回归直线方程,从而得到y与x之间的幂律关系式。
(2)指数分布
指数分布一个重要特征是无记忆性(Memoryless
Property,又称遗失记忆性)。这表示如果一个随机变量呈指数分布,当s,t>0时有P(T>t+s|T>t)=P(T>s)。即,如果T是某一元件的寿命,已知元件使用了t小时,它总共使用至少s+t小时的条件概率,与从开始使用时算起它使用至少s小时的概率相等。其概率密度函数和分布函数如下:
其中λ
> 0是分布的一个参数,常被称为率参数(rate parameter)。即每单位时间内发生某事件的次数。指数分布的区间是[0,∞)。 如果一个随机变量X呈指数分布,则可以写作:X~
E(λ)
2、其他差异
通过数据拟合,发现两者的不同可以用一句话概括,幂律比指数下降的更快。
参考:http://blog.sina.com.cn/s/blog_8f48f45301015ofs.html
泊松分布:http://www.ruanyifeng.com/blog/2015/06/poisson-distribution.html
伽马分布:http://www.tinysoft.com.cn/tsdn/helpdoc../display.tsl?id=12849
相关文章推荐
- 【炉石传说】复仇之怒 vs 德鲁伊+2 * 苦痛诗僧
- 逆分布函数法生成随机数(以指数分布和双指数分布为例)
- 概率图模型(PGM)学习笔记(二)贝叶斯网络-语义学与因子分解
- 机器学习预备知识之概率论(上)
- 数据挖掘中所需的概率论与数理统计知识
- PRML-系列二
- 泊松分布和指数分布:10分钟教程
- max与min函数的概率分布思考
- 泊松分布和指数分布
- 概率论一二章知识点
- Matlab拟合曲线之幂律分布
- 泊松分布和指数分布:10分钟教程
- 主题模型相关的几个概念
- PRML Notes- Chapter2 Probability Distribution(2.1,2.2)
- PRML Notes- Chapter2 Probability Distribution
- TensorFlow 学习(九)—— 初始化函数(概率分布函数 api、常数生成函数)
- 计算网页停留时间的平均时长
- 概率分布 Probability Distributions
- 幂律分布与二八法则
- 理解朴素贝叶斯