贝叶斯定理:我们几乎每天都在使用的数学工具

我们的世界观和因其导致的行为往往是由一个简单的定理促成的,在150多年前,这个定理由一位性格内向的英国数学家和神学家托马斯·贝叶斯(Thomas Bayes)悄悄设计,直到他去世后才将其发表。

贝叶斯定理最著名的运用之一是在二战期间被用来破解纳粹的恩尼格码密码。如今,该定理更是广泛深入的被运用在科学、技术、医学等领域。

但什么是贝叶斯定理?它又是如何运作的呢?

贝叶斯定理

托马斯·贝叶斯的洞察力非常简明。一个假设是真实的概率取决于两个标准:

根据当前的知识(“先验”),判断它的合理程度;

评估它与新的证据的契合程度。

然而,在贝叶斯去世后的100多年里,科学家通常仅通过对新的证据来评估他们提出的假设。这是我们大多数人在科学课上受到的传统的假设-检验(频率论者)方法的教育。 当一个不合理的解释与一个新的证据完美契合时,贝叶斯定理和频率论者的方法之间的区别尤为明显。

让我们先来制造一个假设:

“月亮是用奶酪做的!”

△一个不合理的假设。(图片来源:Mike Lee)

接着,我们仰望星空,并收集相关的新证据,并发现月亮的颜色是奶酪黄。在传统的假设-检验框架中,我们会得出新的证据与我们天马行空的假设相符的结论,从而增加了我们对该假设的信心。

△传统的假设-检验方法(频繁方法)只考虑一个假设与新证据的适合程度。(图片来源:Mike Lee)

但如果使用贝叶斯定理,就会得到更加谨慎的结论。我们会意识到虽然这个假设符合新的证据,但这个想法从一开始便极其荒唐,它违背了我们对宇宙学和矿物学所熟识的一切知识。因此,月球是奶酪的综合概率(即这两项评估的乘积)依旧是很低的。

△贝叶斯推理考虑了假设符合现有知识的程度以及它符合新证据的程度。为了简单起见,公式中省略了归一化常数。(图片来源:Mike Lee)

当然,这只是一个极端的例子。没有哪位正经科学家会试图检验这样一个荒诞的假设。 但是,全球科学家们总在不断评估大量的假设,而其中一些假设是相当牵强的。

例如,2010年有一项研究最初表明:

“持有温和政治观点的人可以看到更多的灰色。”

后来这个假设在进一步检验后被驳回,研究人员认识到这是不可信的。然而几乎可以肯定的是,有许多类似的研究已被草率的接受。

生活中的贝叶斯方法

运用先前的经验和记忆中积累的知识、和意识中提炼出的新证据,我们对日常事物的概率进行分配和生活进行管理。

举一个生活中的简单事件:接听手机。通常在工作时你将它放在办公桌上,而在家里时把它放在在充电器上。现在你在家里的小花园里浇花,听到屋内电话声响起。新的数据会告诉你它处于室内任何地方,但你仍会直接走向充电器。因为你将的先前对手机位置的认知(通常在办公桌上或家中的充电器上)与新的证据(房屋的某处)相结合,从而确定了它的位置。

如果手机不在充电器上,那么你会唤起先前你在某些放置过手机的位置的认知来缩小搜索范围。 你会忽略房子里大部分的地方,如冰箱、袜子抽屉等等,因为这些地方在你先前所积累的认知中被认定为极不可能的位置,你会在最终找到电话之前思考最可能的地方。

而在这个找电话的过程中,你便正在使用贝叶斯定理。

认知和证据

贝叶斯推理的一个特征是:当数据较弱时,那么先前对事物的认知是最重要的。这个原则一直被我们直觉性地使用。

例如,你在酒吧玩飞镖,附近的陌生人说他(她)是专业的飞镖选手,那么一开始你很可能会假设这个人在开玩笑。

你对这个陌生人一无所知,但你知道遇到一个真正的专业飞镖选手的几率很小。比如在澳大利亚,专业的飞镖选手只有大约15名。假如他扔了一只飞镖正中靶心,你可能还是不会相信他的说法,因为这可能只是走运的成分。但如果他连续十次都击中靶心,你会更倾向于接受他是专业人士的说法。因为随着新证据的积累,你之前的认知被超越。贝叶斯定理再次起到作用。

一个统管它们的理论

现在,贝叶斯推理支撑着广泛的人类调查领域,从癌症筛查到全球变暖,从遗传学到货币政策等等等等。

例如,贝叶斯推理是风险评估和保险行业的基础。每次飓风或洪水袭击一个地区时,保险费都会飞涨。为什么?

△ 飓风Debbie席卷澳大利亚昆洲,带来的强降雨将居民房屋包围在洪水中。(图片来源:Dan Peled/AAP Image)

量化风险是一件非常复杂的事情,而且目前的条件不足以对未来可能发生的灾难提供足够多的信息。因此,保险公司会根据现时情况并结合过往发生的情况来估算风险。每当自然灾害发生一次时,他们就对该地区的信息进行更新,预计未来索赔的可能性将更大,因此提高保险费。

在医学诊断中,贝叶斯推理也同样发挥着重要作用。一个症状(新证据)可以是多种可能的疾病(假设)的结果,但不同的疾病对于不同的人来说具有不同的先验概率。而在线医疗工具无法将个人的先验概率恰当的考虑在内,这也正是在线医疗的主要问题。它们对你的个人历史知之甚少,因此会忽略一系列可能的疾病。

贝叶斯定理再次告诉我们:向一位了解你之前病史的医生求诊,能获得更高效合理的诊断。

阿兰·图灵和恩尼格码

贝叶斯方法能让我们从模糊的数据中提取准确的信息,从无限可能性的范围中找出更有针对性的解决方案。

这也是阿兰·图灵当年破解德国恩尼格码的核心,它加速了二战的结束,挽救了数百万人的生命,对全世界都意义非凡。若是要在无数的潜在翻译下进行搜索是不可能破译一组加密的德文信息的,尤其是恩尼格码通过不同的转子设置每天变化。

图灵关键的贝叶斯洞察力是一些特定信息比其他信息更有可能,这些可能的解决方案都是基于以前的成功破译的信息和符合逻辑的期望。例如,德国的U型潜艇的信息可能包含与天气或盟军航运相关的短语。

类似这样的先验信息极大地缩小了可能需要评估的翻译数量,使得图灵的密码破译机能以超过日常变化的速度快速破解恩尼格码。

△密码学家用来破解德语恩尼格码的解码机“炸弹”的重建的复制品。(图片来源:Ted Coles/Wikimedia)

我们的世界观和因其导致的行为往往是由一个简单的定理促成的,在150多年前,这个定理由一位性格内向的英国数学家和神学家托马斯·贝叶斯(Thomas Bayes)悄悄设计,直到他去世后才将其发表。

贝叶斯定理最著名的运用之一是在二战期间被用来破解纳粹的恩尼格码密码。如今,该定理更是广泛深入的被运用在科学、技术、医学等领域。

但什么是贝叶斯定理?它又是如何运作的呢?

贝叶斯定理

托马斯·贝叶斯的洞察力非常简明。一个假设是真实的概率取决于两个标准:

根据当前的知识(“先验”),判断它的合理程度;

评估它与新的证据的契合程度。

然而,在贝叶斯去世后的100多年里,科学家通常仅通过对新的证据来评估他们提出的假设。这是我们大多数人在科学课上受到的传统的假设-检验(频率论者)方法的教育。 当一个不合理的解释与一个新的证据完美契合时,贝叶斯定理和频率论者的方法之间的区别尤为明显。

让我们先来制造一个假设:

“月亮是用奶酪做的!”

△一个不合理的假设。(图片来源:Mike Lee)

接着,我们仰望星空,并收集相关的新证据,并发现月亮的颜色是奶酪黄。在传统的假设-检验框架中,我们会得出新的证据与我们天马行空的假设相符的结论,从而增加了我们对该假设的信心。

△传统的假设-检验方法(频繁方法)只考虑一个假设与新证据的适合程度。(图片来源:Mike Lee)

但如果使用贝叶斯定理,就会得到更加谨慎的结论。我们会意识到虽然这个假设符合新的证据,但这个想法从一开始便极其荒唐,它违背了我们对宇宙学和矿物学所熟识的一切知识。因此,月球是奶酪的综合概率(即这两项评估的乘积)依旧是很低的。

△贝叶斯推理考虑了假设符合现有知识的程度以及它符合新证据的程度。为了简单起见,公式中省略了归一化常数。(图片来源:Mike Lee)

当然,这只是一个极端的例子。没有哪位正经科学家会试图检验这样一个荒诞的假设。 但是,全球科学家们总在不断评估大量的假设,而其中一些假设是相当牵强的。

例如,2010年有一项研究最初表明:

“持有温和政治观点的人可以看到更多的灰色。”

后来这个假设在进一步检验后被驳回,研究人员认识到这是不可信的。然而几乎可以肯定的是,有许多类似的研究已被草率的接受。

生活中的贝叶斯方法

运用先前的经验和记忆中积累的知识、和意识中提炼出的新证据,我们对日常事物的概率进行分配和生活进行管理。

举一个生活中的简单事件:接听手机。通常在工作时你将它放在办公桌上,而在家里时把它放在在充电器上。现在你在家里的小花园里浇花,听到屋内电话声响起。新的数据会告诉你它处于室内任何地方,但你仍会直接走向充电器。因为你将的先前对手机位置的认知(通常在办公桌上或家中的充电器上)与新的证据(房屋的某处)相结合,从而确定了它的位置。

如果手机不在充电器上,那么你会唤起先前你在某些放置过手机的位置的认知来缩小搜索范围。 你会忽略房子里大部分的地方,如冰箱、袜子抽屉等等,因为这些地方在你先前所积累的认知中被认定为极不可能的位置,你会在最终找到电话之前思考最可能的地方。

而在这个找电话的过程中,你便正在使用贝叶斯定理。

认知和证据

贝叶斯推理的一个特征是:当数据较弱时,那么先前对事物的认知是最重要的。这个原则一直被我们直觉性地使用。

例如,你在酒吧玩飞镖,附近的陌生人说他(她)是专业的飞镖选手,那么一开始你很可能会假设这个人在开玩笑。

你对这个陌生人一无所知,但你知道遇到一个真正的专业飞镖选手的几率很小。比如在澳大利亚,专业的飞镖选手只有大约15名。假如他扔了一只飞镖正中靶心,你可能还是不会相信他的说法,因为这可能只是走运的成分。但如果他连续十次都击中靶心,你会更倾向于接受他是专业人士的说法。因为随着新证据的积累,你之前的认知被超越。贝叶斯定理再次起到作用。

一个统管它们的理论

现在,贝叶斯推理支撑着广泛的人类调查领域,从癌症筛查到全球变暖,从遗传学到货币政策等等等等。

例如,贝叶斯推理是风险评估和保险行业的基础。每次飓风或洪水袭击一个地区时,保险费都会飞涨。为什么?

△ 飓风Debbie席卷澳大利亚昆洲,带来的强降雨将居民房屋包围在洪水中。(图片来源:Dan Peled/AAP Image)

量化风险是一件非常复杂的事情,而且目前的条件不足以对未来可能发生的灾难提供足够多的信息。因此,保险公司会根据现时情况并结合过往发生的情况来估算风险。每当自然灾害发生一次时,他们就对该地区的信息进行更新,预计未来索赔的可能性将更大,因此提高保险费。

在医学诊断中,贝叶斯推理也同样发挥着重要作用。一个症状(新证据)可以是多种可能的疾病(假设)的结果,但不同的疾病对于不同的人来说具有不同的先验概率。而在线医疗工具无法将个人的先验概率恰当的考虑在内,这也正是在线医疗的主要问题。它们对你的个人历史知之甚少,因此会忽略一系列可能的疾病。

贝叶斯定理再次告诉我们:向一位了解你之前病史的医生求诊,能获得更高效合理的诊断。

阿兰·图灵和恩尼格码

贝叶斯方法能让我们从模糊的数据中提取准确的信息,从无限可能性的范围中找出更有针对性的解决方案。

这也是阿兰·图灵当年破解德国恩尼格码的核心,它加速了二战的结束,挽救了数百万人的生命,对全世界都意义非凡。若是要在无数的潜在翻译下进行搜索是不可能破译一组加密的德文信息的,尤其是恩尼格码通过不同的转子设置每天变化。

图灵关键的贝叶斯洞察力是一些特定信息比其他信息更有可能,这些可能的解决方案都是基于以前的成功破译的信息和符合逻辑的期望。例如,德国的U型潜艇的信息可能包含与天气或盟军航运相关的短语。

类似这样的先验信息极大地缩小了可能需要评估的翻译数量,使得图灵的密码破译机能以超过日常变化的速度快速破解恩尼格码。

△密码学家用来破解德语恩尼格码的解码机“炸弹”的重建的复制品。(图片来源:Ted Coles/Wikimedia)


相关文章

  • 毕业生就业数据分析系统开发毕业设计
  • 毕业生就业数据分析系统开发 毕业设计(论文)原创性声明和使用授权说明 原创性声明 本人郑重承诺:所呈交的毕业设计(论文),是我个人在指导教师的指导下进行的研究工作及取得的成果.尽我所知,除文中特别加以标注和致谢的地方外,不包含其他人或组织已 ...查看


  • 算法杂货铺
  • 算法杂货铺 算法杂货铺............................................................................................................. ...查看


  • 概率论发展史
  • 17世纪,正当研究必然性事件的数理关系获得较大发展的时候,一个研究偶然事件数量关系的数学分支开始出现,这就是概率论. 早在16世纪,赌博中的偶然现象就开始引起人们的注意.数学家卡丹诺(Cardano)首先觉察到,赌博输赢虽然是偶然的,但较大 ...查看


  • 曾被世人忽略的重大科学设想
  • 曾被世人忽略的重大科学设想 不少值得人们关注的科学构想在问世之初往往被人们忽视,甚至遭到扼杀.虽然它们的提出也许是一挥而就,但后来不仅得到了确证,甚至被认为具有改变世界的意义.事实上,科学的价值不仅在于满足人类的好奇心,更在于其不可限量的实 ...查看


  • 基于最小风险贝叶斯决策油藏质量分类器设计
  • 北华大学 基于最小风险贝叶斯决策油藏质量分类 器设计 学院: 电气信息工程学院 . 班级: 姓名: 学号: 摘 要:油藏分类方法研究是为了更好的对油藏进行管理,提高对油气田的开发.目前对油藏的分类有很多标准,如粘度.密度.孔渗性等根据原有物 ...查看


  • 概率论与数理统计简史
  • 概率论与数理统计简史 概率论与数理统计是一门研究随机现象规律的数学分支.其历史悠久,应用广泛,发展迅速. 概率论起源于十七世纪中叶,当时在误差.人口统计.人寿保险等范筹中,需要整理和研究大量的随机数据资料,这就孕育出一种专门研究大量随机现象 ...查看


  • 人工智能原理教案03章不确定性推理方法3.5贝叶斯网络
  • 3.5 贝叶斯网络 贝叶斯网络是一系列变量的联合概率分布的图形表示. 一般包含两个部分,一个就是贝叶斯网络结构图,这是一个有向无环图(DAG),其中图中的每个节点代表相应的变量,节点之间的连接关系代表了贝叶斯网络的条件独立语义.另一部分,就 ...查看


  • 数学的广阔前景
  • [摘要]本文主要介绍数学的重要分支――应用数学,包括数学向其他学科的渗透.与其他学科的交叉发展,从而了解更多的数学常识及数学的实际应用. [关键词]应用数学:渗透:独立学科:计算数学 数学的广泛渗透与应用是它一贯的特点,但在数学史上,数学的 ...查看


  • 假设检验中的P值应用研究
  • 摘要: 本文介绍了经典统计学派(P值 显著性水平)在数理统计中的地位,分析了P值及显著性水平的含义以及应该如何正确理解P值.指出了P值的优点及不足之处.并对两个学派的假设检验进行了比较和述评,给出了单参数假设检验时P值的计算公式. Abst ...查看


热门内容