网站公告: k8凯发下载-凯发在线娱乐
新闻动态您当前的位置:官网首页 > 新闻动态 >

浅谈运营工作中的贝叶斯陷阱 武大三行情书

更新时间:2019-10-03 15:57

贝叶斯定理广泛应用于各类场景,如机器学习、大数据挖掘、工程分析、金融投资等,本文仅探讨贝叶斯定理在运营数据分析中的一点思考。

一、什么是贝叶斯定理

贝叶斯定理是关于随机事件A和B的条件概率的一则定理。

频率主义学派认为参数是客观存在的,即使是未知的,但都是固定值,不会改变。频率学派认为进行一定数量的重复实验后,如果出现某个现象的次数与总次数趋于某个值,那么这个比值就会倾向于固定。

最简单的例子就是抛硬币了,在理想情况下,我们知道抛硬币正面朝上的概率会趋向于1/2,而贝叶斯提出了一种截然不同的观念,他认为概率不应该这么简单地计算,而需要加入先验概率的考虑。先验概率也就是说,我们先设定一个假设,然后通过一定的实验来证明/推翻这个假设,这就是后验。随后,旧的后验会成为一个新的先验。

以下便是贝叶斯公式:

P 是在B发生的情况下,事件A发生的概率;

P是A发生的概率;

P是在A发生的情况下B发生的概率;

P 是B发生的概率。

简单讲,贝叶斯定律是在已知某条件的前提下,推算某事件发生的概率。

二、贝叶斯定律的应用

贝叶斯方法对于由证据的积累来推测一个事物发生的概率具有重大作用,它告诉我们当我们要预测一个事物,我们需要的是首先根据已有的经验和知识推断一个先验概率,然后在新证据不断积累的情况下调整这个概率。

我们以下面的例子,来一窥贝叶斯定律的妙用。

如果某种疾病的发病率为千分之一,现在有一种试纸,他在患者得病的情况下,有99%的准确率判断患者得病;在患者没得病的情况下,有5%的可能误判患者得病。现在试纸说一个患者得了病,那么患者真的得病的概率是多少?

为了方便理解,我们先通过一个树形图进行判断,我们假设有100000的人群。

通过以上树状图,逻辑就会比较清晰。在题干给出的条件下,患者真正的得病率是多少呢?用真正得病的99作为分子,测出有病的4995+99作为分母,99÷=1.94%

在此案例中,用贝叶斯公式计算:

P代表试纸查出患病前提下,真实的患病概率;

P代表真实患者概率,即0.1%;

P代表健康人群概率,即99.9%;

P代表试纸查出患者的概率;

P为真实患者条件下试纸查出患者的概率,即99%;

P为健康人群条件下试纸误判为患者的概率,即5%;

编辑:陈红

【返回列表页】
地址:广东省广州市天河区88号    电话:    传真: