[258]先验概率、似然函数与后验概率(2) — ScalersTalk成长会 – 持续行动,刻意学习 – ScalersTalk Wonderland

[258]先验概率、似然函数与后验概率(2)

雕虫小技 scalerstalk 浏览 0条评论

16.jpg

欢迎关注ScalersTalk。IT人,搞技术,聊英语,玩口译,话学术,谈生活。学习成长,笔耕不辍。回复m查看文章列表,或者访问S君小站ScalersTalk.com

你现在看到的是技术系列文章,目前已经发表的文章如下,回复括号数字可阅读。

海量数据处理系列的前两篇:

[213]签名:集合的归纳描述

[207]海量数据相似性检测:文档的抽块处理(Shingling)

其他系列:

[152]清高与小我:谈技术人员的优越感(4)

[150]清高与小我:谈技术人员的优越感(3)

[149]清高与小我:谈技术人员的优越感(2)

[148]清高与小我:谈技术人员的优越感(1)

[112]扯点密码学:可证明安全随笔

[250]机器学习成长笔记(1)

[251]机器学习三要素:机器学习成长笔记(2)

[253]为什么需要机器学习:机器学习笔记(3)

[254]有监督学习和无监督学习:机器学习笔记(4)

[257]先验概率、似然函数与后验概率(1)

公式采用Latex编辑,可以在原文链接里看到转化后的版本。

来先举一个例子:

如果有一所学校,有60%是男生和40%是女生。女生穿裤子与裙子的数量相同;所有男生穿裤子。一个观察者,随机从远处看到一名学生,观察者只能看到该学生穿裤子。那么该学生是女生的概率是多少?这里题目中观察者比如近似眼看直接不清性别,或者从装扮上看不出。答案可以用贝叶斯定理来算。

用事件 $$G$$ 表示观察到的学生是女生,用事件$$T$$表示观察到的学生穿裤子。于是,现在要计算$$P(G|T) $$,我们需要知道:

$$P(G) $$,表示一个学生是女生的概率,这是在没有任何其他信息下的概率。这也就是我们说的先验概率。由于观察者随机看到一名学生,意味着所有的学生都可能被看到,女生在全体学生中的占比是$$40%$$,所以概率是$$0.4$$

$$P(B)$$,是学生不是女生的概率,也就是学生是男生的概率,也就是在没有其他任何信息的情况下,学生是男生的先验概率。$$B$$事件是$$G$$事件的互补的事件,这个比例是$$60%$$,也即$$0.6$$

$$P(T|G)$$是在女生中穿裤子的概率,根据题目描述,是相同的$$0.5$$。这也是$$T$$事件的概率,given $$G$$事件。

$$P(T|B)$$是在男生中穿裤子的概率,这个值是1

$$P(T)$$ 是学生穿裤子的概率,即任意选一个学生,在没有其他信息的情况下,TA穿裤子的概率。如果要计算的话,那可以计算出所有穿裤子的学生的数量,除以总数,总数可以假设为常数$$C$$,但是最后会被约去。或者根据全概率公式$$P(T) =P(T|G)P(G) + P(T|B)P(B) $$ 计算得到 $$P(T)= 0.5\times0.4 + 1\times0.6 = 0.8$$

基于以上所有信息,如果观察到一个穿裤子的学生,并且是女生的概率是

\[P(G|T) = \frac{P(T|G) P(G)}{P(T)}= \frac{0.5 \times 0.4}{0.8} = 0.25.\]

这就是贝叶斯公式的一个示例,如果是两个相关的属性,我们只知道其中一些的概率分布情况,就可以根据贝叶斯公式来计算其他的一些后验概率的情况。

公式采用Latex编辑,可以在原文链接里看到转化后的版本。

回复“100小时”查看口译100小时训练计划;回复“十万字”查看十万字视译计划。

S君的口译100小时、十万字视译训练交流QQ群,欢迎加入(群号为231441722)

S君个人微信号,ScalersTalker欢迎添加。

如果你觉得S君的文章对你有用,让你有所思有所想有所行动,不用感谢,打赏请S君喝杯咖啡就行:P 。支付宝账号是

scalerstalk [at] gmail [dot] com

想看更多相关文章,关注 ScalersTalk 回复任意小于标题括号中的三位数字查看。或者去我的站点 ScalersTalk.com 查看历史文章。

与本文相关的文章