资源行业动态深度学习必懂的13种概率分布

深度学习必懂的13种概率分布

2020-01-16 | |  61 |   0

原标题:深度学习必懂的13种概率分布

来源:51CTO      链接:https://ai.51cto.com/art/202001/609443.htm


作为机器学习从业者,你需要知道概率分布相关的知识。这里有一份最常见的基本概率分布教程,大多数和使用 python 库进行深度学习有关。


概率分布概述

image.png


共轭意味着它有共轭分布的关系。

在贝叶斯概率论中,如果后验分布 p(θx)与先验概率分布 p(θ)在同一概率分布族中,则先验和后验称为共轭分布,先验称为似然函数的共轭先验。共轭先验维基百科在这里(https://en.wikipedia.org/wiki/Conjugate_prior)。


多分类表示随机方差大于 2。

n 次意味着我们也考虑了先验概率 p(x)。

为了进一步了解概率,我建议阅读 [pattern recognition and machine learning,Bishop 2006]。

分布概率与特征


1.均匀分布(连续)

代码:https://github.com/graykode/distribution-is-all-you-need/blob/master/uniform.py

均匀分布在 [a,b] 上具有相同的概率值,是简单概率分布。

image.png

 

2.伯努利分布(离散)

代码:https://github.com/graykode/distribution-is-all-you-need/blob/master/bernoulli.py

先验概率 p(x)不考虑伯努利分布。因此,如果我们对最大似然进行优化,那么我们很容易被过度拟合。

利用二元交叉熵对二项分类进行分类。它的形式与伯努利分布的负对数相同。

image.png



3.二项分布(离散)

代码:https://github.com/graykode/distribution-is-all-you-need/blob/master/binomial.py

参数为 n 和 p 的二项分布是一系列 n 个独立实验中成功次数的离散概率分布。

二项式分布是指通过指定要提前挑选的数量而考虑先验概率的分布。 

image.png


4.多伯努利分布,分类分布(离散)

代码:https://github.com/graykode/distribution-is-all-you-need/blob/master/categorical.py

多伯努利称为分类分布。

交叉熵和采取负对数的多伯努利分布具有相同的形式。 

image.png


5.多项式分布(离散)

代码:https://github.com/graykode/distribution-is-all-you-need/blob/master/multinomial.py

多项式分布与分类分布的关系与伯努尔分布与二项分布的关系相同。

image.png



6.β分布(连续)

代码:https://github.com/graykode/distribution-is-all-you-need/blob/master/beta.py

β分布与二项分布和伯努利分布共轭。

利用共轭,利用已知的先验分布可以更容易地得到后验分布。

当β分布满足特殊情况(α=1,β=1)时,均匀分布是相同的。 

image.png


7.Dirichlet 分布(连续)

代码:https://github.com/graykode/distribution-is-all-you-need/blob/master/dirichlet.py

dirichlet 分布与多项式分布是共轭的。

如果 k=2,则为β分布。 

image.png


8.伽马分布(连续)

代码:https://github.com/graykode/distribution-is-all-you-need/blob/master/gamma.py

如果 gamma(a,1)/gamma(a,1)+gamma(b,1)与 beta(a,b)相同,则 gamma 分布为β分布。

指数分布和卡方分布是伽马分布的特例。 

image.png


9.指数分布(连续)

代码:https://github.com/graykode/distribution-is-all-you-need/blob/master/exponential.py

指数分布是 α 为 1 时 γ 分布的特例。

image.png



10.高斯分布(连续)

代码:https://github.com/graykode/distribution-is-all-you-need/blob/master/gaussian.py

高斯分布是一种非常常见的连续概率分布。 

image.png


11.正态分布(连续)

代码:https://github.com/graykode/distribution-is-all-you-need/blob/master/normal.py

正态分布为标准高斯分布,平均值为 0,标准差为 1。

image.png



12.卡方分布(连续)

代码:https://github.com/graykode/distribution-is-all-you-need/blob/master/chi-squared.py

k 自由度的卡方分布是 k 个独立标准正态随机变量的平方和的分布。

卡方分布是 β 分布的特例

image.png


13.t 分布(连续)

代码:https://github.com/graykode/distribution-is-all-you-need/blob/master/student-t.py

t 分布是对称的钟形分布,与正态分布类似,但尾部较重,这意味着它更容易产生远低于平均值的值。

image.png

【作者:佚名    来源:机器学习算法与Python学习】

THE END

免责声明:本文来自互联网新闻客户端自媒体,不代表本网的观点和立场。

合作及投稿邮箱:E-mail:editor@tusaishared.com

上一篇:人工智能如何判断客户的个性?

下一篇:12个现实世界中的机器学习真相

用户评价
全部评价

热门资源

  • 国内人才报告:机...

    近日,BOSS 直聘职业科学实验室 &BOSS 直聘研究院...

  • AI使物联网更智能...

    看到微软对物联网和人工智能的结合感兴趣是一个明...

  • 推荐一批学习自然...

    这里推荐一批学习自然语言处理相关的书籍,当然,...

  • 安防智能化大势下...

    大部分传统安防设备不仅拍摄视野有限,而且无法事...

  • 20亿创业基金、10...

    近日,杭州举办了建设国家新一代人工智能创新发展...