从蒙特霍尔到蓝眼睛岛 (试发表)

非文学 创作
首先要申明这并不是一篇游记,更不是加勒比海盗第五集的剧本,蒙特霍尔(Monty Hall)和蓝眼睛岛(Blue-eyed Island)也都不是地名,而是两个非常有趣且争议极大的数学题。 这两个问题之所以有名,我个人认为和问题本身的表述非常简单易懂不无关系,无论来自什么背景,只要稍微愿意动点脑筋,皆可参与讨论。而诸如“任一单连通封闭的三维流形与三维球面同胚”之类晦涩的问题就很难真正引起普罗大众的广泛兴趣了。 今天中午和几个同事吃饭时谈到了“蓝眼睛岛”,使我联想起了“蒙特霍尔”,尽管两个问题的实质完全不同,但是却都牵涉到了面对新信息做分析抉择的内容。正好又准备在新浪开博,我于是便将两者合在一起凑成了这篇文章,以试水深。 蒙特霍尔这个名称听上去生僻,但实际上就是那道三个门后面有两只羊一部车的著名问题,许多人应该都听说过(……思考过、甚至争得面红耳赤过)。 问题的表述大致是这样的:在某游戏竞赛类电视节目中你面对三个门,后面分别是两只羊和一辆车。假设你随机选了一个门(称之为1号门),这时候,主持人(也就是蒙特霍尔同志)在剩下的两个门(2号和3号)里打开后面是羊的那扇门(假设是2号),并给了你一个可以换选3号门的机会。如果你的目的是为了选到车,请问这时候你应该继续选1号门,还是换到3号门。 争论主要集中在两种意见上,“换”和“无区别”。正确答案当然是换,但是无数的人却对此感到难以信服。 其实解这个问题根本不需要动用条件概率,贝叶斯定理这些数学工具。以我和别人讨论的经验来看,使用这些概率公式的效果其实适得其反。 想通这个问题首先要想明白一个基本事实,那就是如果你最初选了羊的话,换3号门,就一定可以选中车(因为另一只羊被主持人排除了),而你最初选羊的概率是2/3,因此“换”这种战略让你有2/3的命中率。你如果选择“不换”这种战略,那么只有最初就选到车,你才能获得车(概率是1/3)。 从以上分析我们可以看到问题的实质。也就是说,你最初的选择是盲目的,选到车的概率小于一半(1/3),也就是说,车更有可能在另外两个门的后面(2/3)。而主持人(代表新的信息),帮助你从那两个门里筛除了不是车的那个门,通俗地说,本来那2/3的概率分布在两个门里,现在完全都在3号门里了。 如果上面的解释仍不能让你信服,那么你可以设想这样一个极端的例子。 假设你去买彩票,一共有1亿张,其中只有一张能中奖。你先买了一张。注意,此时你中奖的概率微乎其微,基本上就是买了一张废纸。但是这时候工作人员从剩下的99,999,999张彩票里把不中的99,999,998张都撕掉了。请问,这时候你应该选择换剩下的那一张吗?答案是肯定的。 注意,工作人员究竟知不知道哪张彩票会中其实是无关的。他的行为无论是有意识还是碰巧,对你而言都构成一个宝贵的新信息。他帮助你把99,999,998/99,999,999的可能性都浓缩到了剩下的那张彩票上。 如果看到这里你仍坚持认为换和不换没有区别的话,那么……就这样吧。其实这只是一道趣味数学题而已,并不是每个人都必须要想明白的。 记得我本科的时候修了一门研究生级别的数学分析课,讲课的是毕业于麻省理工的一位满头银发的教授,他的口头禅就是:这个问题你要是弄不懂的话就再想想,如果还是想不通的话,那你可能就要考虑自己是不是坐在正确的教室里了…… 起初我觉得那位教授怎么这么没耐心,但是后来我慢慢明白,许多事情其实并不是和每个人都有“缘”,因此不必太执着。就好比我虽然对数学充满了兴趣,最终研究生还是选择念了金融工程。一如我对物理充满了向往,但此生和这门学科的交集大概注定只能是写一部带点物理背景的武侠小说了…… 不过我还是坚持认为蒙特霍尔问题揭示了一个很深刻的道理。在我们人生道路上的很多抉择中,大多数时候我们一开始只能根据当时有限的信息做出一个比较盲目的选择。随着时间的流逝,其实会有很多宝贵的新信息出现。只是我们很多人,已经失去了再次选择的勇气。 王菲曾经唱道:就算疲惫,就算是累,也只能执迷而不悔…… 好,下面讲讲蓝眼睛岛。问题的表述大致是这样的:某岛上共有1000位居民,其中900个长着棕色眼睛,100个长着蓝色眼睛。这个岛上有一个宗教禁忌,就是任何人都不能知道自己眼睛的颜色(无论是通过照镜子、水面观察还是推理获知),一旦知道了自己眼睛的颜色,这位居民第二天就会自杀。居民们能够看到彼此眼睛的颜色,但是绝不会谈论这个话题,另外,该岛的居民都具有完美的逻辑分析能力。有一天,岛上来了一位游客,受到了热情款待,临走时他在欢送集会上当着所有居民的面说道:“能在这里碰到和我一样长着蓝眼睛的人是多么亲切的事啊!” 问:这句话将会给这个岛带来什么样的影响? 争论同样集中在两个答案上。 答案一:没有影响。游客讲的那句话无非是说“岛上至少有一个长着蓝眼睛的居民”,可是岛上每个蓝眼睛的居民都能看到其余99个长着蓝眼睛的人,从而推断出“岛上至少有一个长着蓝眼睛的居民”,因此游客并没有提供任何新信息。 答案二:100天后,所有蓝眼睛的居民都会自杀。 和蒙特霍尔问题一样,第一个答案拥有许多支持者,就算他们部分地承认第二个答案有些道理,也完全搞不懂答案一为什么会错。因为第一个答案的理由看上去是那么的简单直白,无懈可击。 我们可以先通过对一个简单情况的分析来试着理解答案二。 假设岛上只有两个蓝眼睛居民(称他们为A和B),那么他们通过彼此互看仍然知晓“岛上至少有一个蓝眼睛居民”这一事实,但是他们却没有任何办法推知自己眼睛的颜色。而当游客宣布说“岛上至少有一个蓝眼睛”时,情况却会发生变化。等到第二天,A发现B没有自杀时,他便可以推知自己的眼睛只可能是蓝色的(因为如果自己是棕色眼睛,那么B一看四周全是棕眼睛,便可推断出他就是岛上唯一的那个蓝眼睛,从而寻了短见)。 我想没有人会认为上面的分析有任何错误,但是许多人一定感到极度迷惑。旅客的那句看似对岛上所有人都是已知的话究竟包含了什么新的信息呢? 原因就在于,由一个外来者说出“岛上至少有一个蓝眼睛”这句话所包含的信息要比岛民通过互相观察得出同样结论所包含的信息要更丰富。 仍然用两个人的例子:当外来者说话之前,A知道岛上至少有一个蓝眼睛,B也知道岛上至少有一个蓝眼睛。但是A却不知道B知道岛上至少有一个蓝眼睛(因为A不知道自己眼睛的颜色)。反之亦然。 而当外来者说话后,A就知道B也知道岛上至少有一个蓝眼睛,从而可以做出推理。 用通俗的语言来解释的话,就是知识可以分为很多层面,或者说“阶”。妻子知道丈夫出轨了,小三(妻子的闺蜜)也知道他出轨了(因为自己就是出轨对象),这都属于第一层面,或者说“第一阶”的知识。但是小三知不知道妻子已经知道丈夫出轨呢?这就是“第二阶”的知识了。 如果有一天妻子和小三两人逛街时,另一个充满正义感的朋友冲过来将事情捅破,注意,其实妻子和小三都已知道出轨的事,但是这位朋友仍然带来了新信息。此时两人都知道对方知道了。妻子和小三也许都会根据这个新信息来改变她们下一步的策略…… 我为什么会想出一个这样伤风败俗的例子呢? 好吧,还是回到原题,我们将岛上100个蓝眼睛居民编号为A1,A2,A3,……,A100。 游客来之前,A1的一阶知识,是知道“岛上至少有99个蓝眼睛”,A1的二阶知识,则是“知道A2知道岛上至少有98个蓝眼睛”(因为A2不知道自己眼睛的颜色,所以要少一个),A1的三阶知识,则是“知道A2 知道A3知道岛上至少有97个蓝眼睛”……以此类推,他的一百阶知识就是“知道A2知道A3知道A4知道……A100知道岛上至少有0个蓝眼睛”。推理的源头被掐断了,所以这个岛上的蓝眼睛们依然在海边冲浪晒太阳,惬意地活着。 但是游客的话却给出了一个“全阶”的知识,于是谁都知道谁知道……谁知道至少有一个蓝眼睛这件事了,于是最后的那个0变成了1,于是100天后大家发现眼前的蓝眼睛都没有自杀,于是…… 熟悉数学归纳法的人一定可以想到一个简单的证明。我们已经证了两个人的情况,接下来只要证明K个蓝眼睛会自杀的情况下K+1个蓝眼睛也会自杀就行了。我就不再赘述。 当然,真正严格的数学证明要更复杂一些,也需要考虑更多的方方面面。如果谁有兴趣,我可以推荐陶哲轩博客上的这篇文章。 http://terrytao.wordpress.com/2011/04/07/the-blue-eyed-islanders-puzzle-repost/ 陶哲轩是出生于澳大利亚的华裔数学家,2006年菲尔茨奖得主(菲尔茨奖是数学界的最高荣誉)。 另外,如果谁有兴趣的话,可以试着证一个三个蓝眼睛的情况,锻炼一下思维。 小时候读一个故事最后一段话总会写这个故事告诉了我们什么道理。本篇博文也不例外。 这两道和知识/信息有关的数学题告诉我们的道理就是,如果你想获得成功,最好能获得别人不知道的知识和信息,如果不行的话呢,就试着去更深层次地理解人人都以为自己已经知道的新信息吧。 以上便是我在新浪的第一篇博客,如果已经把许多人吓走的话,我只能深表遗憾。其实,为了表示我博学多才,文理兼通(开个玩笑),我希望能在这个博客里涉及语言文学,电影评论,游记随笔,金融数学等多方面的内容。当然也会透露小说《量子江湖》的写作计划。 希望能够一直坚持下去。 ====================== 本文最早发于2011年的新浪博客。 现在转贴过来。
© 版权声明:
本作品版权属于作者陈怅,并受法律保护。除非作品正文中另有声明,没有作者本人的书面许可任何人不得转载或使用整体或任何部分的内容。
1人
最后更新 2012-05-07 18:05:24
非著名物理学渣
2012-05-05 18:50:14 非著名物理学渣

终于活跃起来了~

ZeroJoke
2012-05-07 18:05:41 ZeroJoke

拿这个蒙特霍尔题目问寝室的同学,经过他细心点拨,发现这个问题有两种情况。

问题是算P(中奖|换)和P(中奖|不换)。

如果主持人知道哪扇门有奖,换和不换各模拟100,000次
换 win 66717
不换 lose 66474
换 lose 33283
不换 win 33526

如果主持人不知道哪扇门有奖,只是凑巧开了没有奖的门,换和不换各模拟100,000次
主持人开了有奖的门 66947
换 win 33306
不换 lose 33176
换 lose 33240
不换 win 33331

八圈
2012-05-08 14:27:55 八圈 (的中)

楼上这个怎么模拟的……

ZeroJoke
2012-05-08 19:59:13 ZeroJoke

电脑程序生成伪随机数模拟的

Alfven
2013-03-14 14:49:43 Alfven

楼上,你的第二种情况有点问题。(漏打了“没”字当然不算)
主持人不可能去开已经被选手选定的门,而是只能在剩下的两扇门中随即做选择。不是3选一的问题,而是2选一的问题。这意味着,你的各100,000次模拟中,1/3的模拟是无效的(主持人选了选手的门)。只要将这1/3的结果剔除就能重新得到换win:换lose=2:1的结果