魔鬼数学

数学老师最不希望听到学生说“我明白这个概念,但是不会做题”。其实,这句话的意思就是“我没弄明白这个概念”,只不过这名学生并不自知。

公司在发行共同基金时,通常会先在机构内部持有这笔基金,过一段时间之后才向公众开放。这种做法名为“基金孵化”(incubation),有的基金会拥有很好的回报率,公司很快就开始向公众兜售这些基金,同时提供大量证据证明这些基金拥有的收益情况。而那些收益不佳的基金则被扼杀在襁褓中,公众通常都不知道它们的存在。

告诉你的不是虚假信息,而是真实信息,但是这些真实信息会让你形成错误的结论。

在人们欢呼“天啊,我发现了精神分裂症基因”时,在这些可能获准发表的研究结果中,虚假结果的数量是真实结果的500倍。

约安尼迪斯指出,在这些基因中,大约有10种真的会对精神分裂症产生影响。 那么,其余的99 990种基因呢?这些基因与精神分裂症没有任何关系。但是,其中的1/20或者说5 000种基因,会顺利通过统计学显著性检验。

科学研究的道路上困难重重,我们的大多数观点都是错误的,即使在第一轮检验中侥幸胜出的观点也大多是错误的。

如果没有任何偏见,我们就有可能整天都处于震惊的状态。

即使我们真的在一定程度上相信某个疯狂的想法,也无须担心。当我们得到的证据与这个想法不一致时,我们赋予这个疯狂想法的置信度就会下降,直到与其他人差不多。除非这种疯狂的想法经过精心的设计可以躲过这个筛选程序,阴谋论就是这样起作用的。

U理论就像T理论的保护层,使新证据无法触及T,更不能推翻T。荒诞不经但却非常成功的理论大多有这种共性,这些理论有厚厚的保护层,这些保护层又与很多可观察到的结果并不矛盾,因此很难被打破。

你以为伏尔泰仅凭那些文字优美的随笔与短剧就能维持生计吗?当时与现在一样,靠写作是不可能发大财的。

接近于零的概率与真的等于零的概率是很难区分的。

209.你被主人宠爱就不再是奴隶了吗?奴隶啊,你确实是交了好运,你的主人宠爱你,但他很快也会鞭打你。

帕斯卡的假设只有两个:第一,上帝是真实存在的,而且会奖赏那些信仰他的人;第二,上帝不存在。

如果有某位神一直在诅咒基督教徒呢?这样的神也是有可能存在的。

有的未知信息是已知的,有的未知信息是未知的,在更多情况下,展现在我们眼前的却是“未知的未知信息”。

对于大多数人而言,经营企业是胜算不高的赌博。

如果经营企业,我们将会面临三种结果:一是赚大钱,这个概率非常非常小;二是捉襟见肘、勉强维持生计,这个概率比较大;三是亏本倒闭,这个概率最大。对很大一部分潜在的企业家而言,如果对这些数据加以处理,就像买彩票一样,收益期望值也小于零。

即使在存活下来的企业中,企业主挣的钱通常也不会很多,如果他们去某个公司上班、领薪水,绝大多数情况下收入会更高。

犯错误就像一种原罪,打从一出生我们就会犯错误,而且会不断犯错误,因此,我们必须时刻保持警惕。

相关性是不可传递的。

不存在相关性不代表没有任何关系。

保罗·克鲁格曼(Paul Krugman)指出:“人们希望削减开支,但是反对削减除对外援助以外的所有开支……因此,我们只能认为,共和党人得到了废除运算法则的授权。”

人们面临(至少)三种选择:保持医疗法案不变,废止该法案,或者强化该法案。但是,每一种选择都遭到了大多数美国人的反对。

民意是根本不存在的东西,更准确地讲,只有在大多数人意见一致时民意才会存在。

少数服从多数”原则简单明了,看似公平,但仅在涉及两种观点时,它才能取得最佳效果。只要观点多于两种,大多数人的喜好就会有自相矛盾的地方。

个人之所以不理性,也许是因为他们并不是真正的个体。每个人都是一个小国家,我们要做的就是尽可能地处理各种争端、做出妥协,而最后得到的未必都是合理的结果。

像多头绒泡菌一样,我们也有可能小错不断,但却能做到大错不犯。民主必然包含各种杂音,但是的确能产生某种效果。

哲学家奎因(Quine)指出:“所谓信念,就是相信某个东西是正确的。因此,理性的人相信他的每一个信念都是正确的;然而根据经验,他又会认为自己的某个信念(但是无法确定是哪一个)有可能是错误的。简言之,理性的人会认为自己的每一个信念都是正确的,但又有一些信念是错误的。”

我们习惯于认为失败不是一件好事,但并不是所有的失败都是坏事,因为我们也可以从失败中学到一些东西。

在菲茨杰拉德思想中相互矛盾的两个理念是“努力奋斗的徒劳感与奋力拼搏的必要性”。

曾经尝试过,也失败过,但是没关系,再尝试、再失败,每一次失败都是进步。

如果你选择足球作为谋生手段或者希望加入校队,你就别无选择,只能利用周末时间,在训练场上接受大量枯燥乏味的训练。

如果去医院的病房看看,就会发现腿部受创的病人比胸部中弹的病人多,其原因不在于胸部中弹的人少,而是胸部中弹后难以存活。

在这个例子中,军官们在不经意间做出了一个假设:返航飞机是所有飞机的随机样本。如果这个假设真的成立,我们仅依据幸存飞机上的弹孔分布情况就可以得出结论。

导致弹孔问题的是一种叫作“幸存者偏差”(survivorship bias)的现象。

如果在计算收益率时把那些已经消亡的基金包含在内,总收益率就会降到134.5%,年均收益率就是非常一般的8.9%。

我们所掌握的知识远比我们尚未掌握的少。

如果不从事某些数学活动,就很难理解数学的真谛。

线性与非线性之间的差异,这是数学领域最重要的差异之一。

非线性思维表明,正确的前进方向取决于你当前所在的位置。

贺拉斯(Horace)有一个著名的论断:事物有中道,过犹不及。

很多持有非主流观点的人把自己比作爱迪生与伽利略,但是这些人的观点没有一个是对的。

我敢保证阿尔伯特·爱因斯坦(Albert Einstein)没有到处宣扬:“我知道你们觉得我的广义相对论非常荒谬,人们当年还说伽利略的成果非常荒谬呢!”

(里根)经常说:“‘二战’期间,我通过拍电影赚了大钱。”当时,战时收入附加税高达90%。里根说:“拍了4部电影之后,我的所得税率就到了最高等级。于是,我在完成了4部电影的拍摄之后就不再工作,跑到乡下度假去了。”

里根当选总统后实行了减税政策,结果税收不但没有增加,反而减少了。

在弗里德曼看来,政府的收入最终会用作政府的开支,但是,这些钱的使用方式并不是很恰当。

线性推理却无处不在,只要你认为“某个东西有价值,因此多多益善”,就是一种线性推理。

牛顿发现所有的线都与直线非常接近,由此催生了“线性回归”(linear regression)这个概念。

在教授数学时,应该告诉学生如何应用人的智慧,否则,我们培养出来的学生从本质上就会与微软的Excel程序没什么两样,而且反应迟钝、漏洞百出。

数学老师最不希望听到学生说“我明白这个概念,但是不会做题”。其实,这句话的意思就是“我没弄明白这个概念”,只不过这名学生并不自知。

20世纪70年代初,体重指数超过25的美国人不足半数,到90年代初,这个数字接近60%,到2008年,几乎有3/4的美国人都超重了。

随着硬币的数量越来越多,正面朝上的概率明显地向50%靠近,

硬币的枚数(我们在统计学中称之为“样本大小”)越少,正面朝上的硬币所占比例的变异性就会越显著。

前25名之所以大多是规模小的学校,并不是因为这些学校更加优秀,而是因为它们的考试分数更加多变。只要有几名天才学生或者三流的差生,它们的平均成绩就会发生很大的起伏。

平均定律”(law of averages)的陷阱:认为在出现数次正面朝上之后,下一枚硬币几乎肯定是反面朝上;或者认为在生了三个男孩之后,下一个肯定会生女儿。

1990~2008年,美国经济实际创造了2 730万个就业岗位,其中,有2 670万个(占98%)来自非贸易部门,即政府、医疗、零售与饮食服务等领域,这些领域的工作不可外包,产品也不可销往海外。

前景一片黯淡、看不到一点儿希望的是剩余90%的人口。

罗姆尼团队错失了一个良机。如果他们在奥巴马就任总统满一个月后,即从2009年2月开始计算美国女性的就业情况,他们就可以理直气壮地指出,在奥巴马任期内,女性损失的工作岗位数在岗位减少总数中占3 000%!

《华盛顿邮报》对罗姆尼团队提出的92.3%这个数字给出的评价是“真实但是不正确”。

《托拉》是一个很长的文本,只要我们耐心寻找,总可以从中找出某些规律。

公司在发行共同基金时,通常会先在机构内部持有这笔基金,过一段时间之后才向公众开放。这种做法名为“基金孵化”(incubation),但是,基金孵化并不像它的名称暗示的那样温馨安全。通常,公司会同时孵化多笔基金,尝试无数种投资策略与投资额度,让这些基金在母体中相互竞争。有的基金会拥有很好的回报率,公司很快就开始向公众兜售这些基金,同时提供大量证据证明这些基金拥有的收益情况。而那些收益不佳的基金则被扼杀在襁褓中,公众通常都不知道它们的存在。

基金一旦到了公众手中,就无法维持它们在公开发行之前的优秀业绩,其收益情况大致只能处于中游水平。

告诉你的不是虚假信息,而是真实信息,但是这些真实信息会让你形成错误的结论。

小概率事件并不少见。遭遇雷击或者彩票中奖的可能性就非常小,但是这样的事情却在不断发生。

2007年7月9日,北卡罗来纳州“34选5”彩票开出了“4、21、23、34、39”这个中奖组合,两天后这组数字再次中奖。

如果我们试图从小概率事件中得出可靠的参考信息,回旋余地就是我们应当规避的大敌。

借助回旋余地,那位巴尔的摩的股票经纪人为自己的成功创造了大量机会,共同基金公司在判断秘密孵化的基金孰优孰劣时可以使自己处于不败之地,马凯与巴纳丹则提出了一组适合对《战争与和平》进行密码分析的拉比的姓名。

2009年,在旧金山召开的国际人脑成像组织大会上,加州大学圣塔芭芭拉分校的神经学家克雷格·班尼特(Craig Bennett)做了一个会议报告,题目是“大西洋死鲑鱼对人类神经活动的观察——论多重比较修正的重要性”。

文艺复兴后期,一些代数学家在意大利四处游历,以金钱与地位为赌资,与人在公开场合打赌求解方程式。在这个过程中,一元三次方程式诞生了。

大白菜吃多了也会要人命。

有9/10的球迷认为,球员在连续投中两三个球之后,下一次投篮命中的可能性更大。

人类倾向于在不存在规律的地方总结出规律,在存在某种规律的地方又会夸大这些规律的影响力。

人们经常会把“可能性极小”理解成“基本不可能”,

张益唐在北京大学就读时成绩斐然,但在20世纪80年代赴美国攻读博士之后却未取得任何成果。自2001年以来,他没有发表过一篇论文,还一度在地铁站卖三明治。

他的一位从北京来到美国的老同学找到他,帮他在新罕布什尔州大学获得了一个非终身讲师的职位。

你发现绵羊肝脏的纹路与凸起部位真的可以预测第二年流感爆发的严重程度。

肠卜僧有成百上千个,被开膛破肚的绵羊为数更多,因此,即使预测成功的概率仅为1/20,这些成功的实验也能提供大量的证明材料,

希腊人约翰·约安尼迪斯(John Ioannidis)。2005年,这位由中学数学明星蜕变而成的生物研究人员,发表了一篇题为“公开发表的研究成果大多不真实的原因何在”的论文,

约安尼迪斯严肃地指出,医学研究和肠卜术一样,找不到任何有实际效果的内容,所有的专科就是一个个“毫无内涵的领域”。他认为:“我们可以证明,得到发表的医学研究成果大多是不真实的。”

约安尼迪斯认为,我们在医学上尝试使用的介入治疗法大多不会起作用,我们所检测的各种关系大多是子虚乌有。

在人们欢呼“天啊,我发现了精神分裂症基因”时,在这些可能获准发表的研究结果中,虚假结果的数量是真实结果的500倍。

约安尼迪斯指出,在这些基因中,大约有10种真的会对精神分裂症产生影响。 那么,其余的99 990种基因呢?这些基因与精神分裂症没有任何关系。但是,其中的1/20或者说5 000种基因,会顺利通过统计学显著性检验。

科学研究的道路上困难重重,我们的大多数观点都是错误的,即使在第一轮检验中侥幸胜出的观点也大多是错误的。

如果想了解真实情况,还需要考虑那些没有返航的飞机。

所谓的具有统计学显著性的实验结果,不过是通过操控数据去迎合自己的预期罢了。

有些实验难以重复。如果我们的研究内容是检验4岁儿童延迟满足的能力,以及这项能力与该儿童30年后的生活状况之间的相关性,那么我们无法轻易地通过重复实验验证这项研究结果。

谷歌、脸谱网、智能手机甚至塔吉特公司,甚至比我们的父母更加了解我们,

1/20这个统计学显著性的临界值。

单纯地依靠零假设显著性检验的做法,严重违背了贝叶斯推理的精神。严格地讲,这种做法会让人认为抗癌药物与巨石阵塑料模型有相同的疗效。

相较于复杂想法以及以完全陌生的现象为基础的想法,我们往往更喜欢简单的想法和那些通过类比我们所熟知的事物而产生的想法。

如果没有任何偏见,我们就有可能整天都处于震惊的状态。

某种打法律“擦边球”的精神药物,就会知道一视同仁的先验概率会给我们带来什么样的感觉。服用了那种药物之后,所有刺激都会让我们觉得意义深刻,无论这种刺激是多么平常。每种体验都会激起我们的兴趣,让我们欲罢不能。这样的精神状态非常有趣,但无助于我们做出正确的推理。

如果没有任何偏见,我们就有可能整天都处于震惊的状态。理查德·费曼(Richard Feynman)有一段非常有名的话,描述的正是这种心理状态。 大家知道吗,今晚我遇到了一件非常奇怪的事。就在我来这儿的路上,当我从停车场经过时,一件令人难以置信的事情发生了,我看到一辆车的车牌号为ARW357。大家想一想,我们州有好几百万个车牌号,今天晚上我看到这个车牌号的概率是多少?这太让人吃惊了!

即使我们真的在一定程度上相信某个疯狂的想法,也无须担心。当我们得到的证据与这个想法不一致时,我们赋予这个疯狂想法的置信度就会下降,直到与其他人差不多。除非这种疯狂的想法经过精心的设计可以躲过这个筛选程序,阴谋论就是这样起作用的。

假设你深信的一位朋友说,波士顿马拉松爆炸案是联邦政府监守自盗的产物,目的是让更多公众支持美国国家安全局窃听个人电话(我随便说说而已,大家千万别当真)。我们把这个定义为T理论。由于你信任这位朋友,因此你一开始就为这个理论赋予了一个较大的先验概率,比如说0.1。但是,随后我们获取了其他信息,诸如,警察已经锁定嫌犯的位置,侥幸活命的嫌犯供认不讳等。如果T为真,这些信息为真的可能性就会非常小,因此,每一条信息都会使T的置信度逐渐降低,直到我们不再相信它。

随着证据逐渐增多,这些证据往往只能削弱T的置信度,而T+U结合体却不受任何影响。

朋友不会直接把T理论告诉我们,而会先告诉我们U理论,即政府与媒体都参与了这个阴谋,比如,报纸与有线电视网散播了爆炸案是穆斯林极端分子制造的假消息。

开始时,T+U结合体的先验概率更小。从本质上讲,这个结合体比T更令人难以置信,因为它要求我们同时相信T和U理论。但是,随着证据逐渐增多,这些证据往往只能削弱T的置信度,而T+U结合体却不受任何影响。

U理论就像T理论的保护层,使新证据无法触及T,更不能推翻T。荒诞不经但却非常成功的理论大多有这种共性,这些理论有厚厚的保护层,这些保护层又与很多可观察到的结果并不矛盾,因此很难被打破。

周围的人都认为他是学校里最不讲卫生的人,因为他总穿着那件T恤。实际上,他是学校里最讲卫生的人,因为他每天都会穿一件刚从床底下拿出来的干净的新T恤。

福尔摩斯应该这样说:“我的座右铭是:如果你将不可能排除在外,那么剩下的,无论可能性多么小,都必然是事实,除非它是你没有考虑到的那个假设。”

布莱士·帕斯卡(Blaise Pascal)的话。这位17世纪的数学家、哲学家在《思想录》(Pensées)中说:“‘上帝要么存在,要么不存在。’但是,我们到底应该相信哪种观点呢?在这个问题上,推理得不出任何答案。”

现在,几乎没有人赌狗了,但无论是赛马、职工优先认购权、彩票还是人寿保险,它们的期望值机制都是相同的。

我父亲以前是美国统计协会的主席,也玩强力球,而且经常会帮我买一张,所以我也算玩家之一。

我中不了大奖的概率是174 999 999/175 000 000,我父亲中不了大奖的概率也是174 999 999/175 000 000,因此,我们两个人都中不了大奖的概率就是: 174 999 999/175 000 000×174 999 999/175 000 000 即99.999 999 4%。

我们最好不要买彩票,父亲每次买彩票,我都会这样劝他。

(174 999 999/175 000 000)750 000 000=0.651…… 也就是说,其他玩家中不了大奖的概率约为65%,其中至少有一个人中奖的概率为35%。

彩票是州政府发行的。

如果你希望在强力球上有所斩获,最佳策略是什么呢?下面是经过数学验证的三个策略: 1.别玩强力球。

彩票销售额为500万美元,销售量为250万张。当“Cash WinFall”的销售量超过这个数字时,就不宜参与。但是,只要销售量低于这个数字(“WinFall”彩票的销售量从未超出这个数字),玩家就可以赚钱。

一位物理学家接到一个优化奶品生产的任务,他满怀信心地说“假设有一头球形的奶牛……” 循着让问题简单化的思路,我们有可能从更简单的“frand-carreau”游戏中找到灵感,帮助我们解决布封投针问题:“假设有一根圆形的缝衣针……”。

2012年1月23日,“Cash WinFall”完成了它的最后一次开奖(确切地说,是最后一次累积奖金向下分配后的开奖)。

你以为伏尔泰仅凭那些文字优美的随笔与短剧就能维持生计吗?当时与现在一样,靠写作是不可能发大财的。

哈维、张博士与塞尔比这三个团队从政府金库中赚取了好几百万美元,为什么马萨诸塞州政府却无动于衷呢?有哪一家赌场会任凭玩家一周又一周地击败庄家而不采取任何行动呢?

玩家中奖所得的那些钱本来就不是马萨诸塞州政府的,从一开始这笔钱就要以奖金的形式返还给玩家。政府从每张彩票中拿走0.80美元,然后把剩余的钱返还给玩家。销售的彩票越多,政府的收益就越高。政府不关心谁会中奖,他们关心的是有多少人参与这项活动。

这些博彩团队没有击败庄家,因为他们就是庄家。

像哈维这样的彩票大户追求的并不是乐趣,他们的所有行动都秉承了一个简单的理念:如果博彩活动令人热血沸腾,就说明他们的参与方式是错误的。

博彩团队购买几十万张彩票,会大幅增加各奖项的中奖彩票数,因此,每张中奖彩票的价值会降低。从这个意义上讲,博彩团队对普通玩家的利益造成了伤害。

1982年的诺贝尔经济学奖得主乔治·施蒂格勒(George Stigler)说过:“如果你从来没有误过飞机,那只能说明你浪费在机场的时间太多。”

甚至有人希望使用某个叫作“效用度”的标准单位来计量效用。打个比方,假设在家一小时的效用为一个效用度,那么提前两个小时赶到机场的成本就是两个效用度,而提前一个小时的成本仅为一个效用度。

根据经济学标准理论,人们在理性情况下做出的决策都将发挥最大效用(utility)。

接近于零的概率与真的等于零的概率是很难区分的。

杜绝所有浪费行为,与把误机概率从非常低降到零一样,其成本超过收益。

我们不应该问“政府为什么要浪费纳税人的钱”,正确的问题是“政府浪费纳税人的钱以多少为宜”。

如果我们的政府没有浪费行为,那只能说明他们在反浪费方面花了太多的时间。

哪些赌博游戏的期望值为正,哪些为负。人们普遍认为,帕斯卡与费马之间的信件往来代表了概率论的产生过程。

209.你被主人宠爱就不再是奴隶了吗?奴隶啊,你确实是交了好运,你的主人宠爱你,但他很快也会鞭打你。

帕斯卡的假设只有两个:第一,上帝是真实存在的,而且会奖赏那些信仰他的人;第二,上帝不存在。

如果有某位神一直在诅咒基督教徒呢?这样的神也是有可能存在的。单凭这个可能性,我们就可以驳斥帕斯卡的论断:如果信仰基督教,我们就有可能得到无穷大的愉悦,但是也有可能遭受无穷大的痛苦,而且我们没有任何公正合理的办法可以计算出出现这两种结果的相对概率。这样,我们就又回到了原点,推理已经无能为力了。

帕斯卡的目标不是让我们相信上帝存在,而是让我们相信信仰上帝会为我们带来好处。

有钱人手中的一个达科特,跟农民手中的一个达科特,两者的效用并不相同。

2 000个达科特的效用并不等于1 000个达科特的2倍,而是略少于后者的2倍。

对于不同情景中不同的人来说,金钱的效用也是不同的,所以,普适性的效用曲线根本不存在。

金钱的数量一旦超过某个界限,就几乎丧失了所有效用,不能使人们的愉悦感进一步提升。发现一座金山的人,未必比发现1立方英寸金块的人更幸福。

有的未知信息是已知的,有的未知信息是未知的,

在更多情况下,展现在我们眼前的却是“未知的未知信息”。

钱越多,你所能承受的风险也越大。

我们生活在牵一发而动全身的世界,全球经济就像由锈蚀的钉子与腐烂的绳子搭建而成的摇摇欲坠的巨型树屋,一个部位出现大面积坍塌,整个树屋就很可能会轰然倒塌。

老话说得好:“如果你欠了100万美元,那是你自己的问题;但是,如果你欠了50亿美元,那就是政府的问题了。”

在30个人中,有两个人的生日在同一天的概率超过70%,

如果你希望在美国50个州中为自己的公司选择最有利的驻地,这个目的不难实现,你只需要比较这50个州就可以了。但是,如果你希望找出穿行这50个州而且效率最高的路线,也就是所谓的“旅行商问题”(traveling salesman problem),就会发生组合爆炸。

只要有人声称借助数学方法可以解释、征服或者彻底了解这样或那样的事物,我们都不可以盲目相信。

光盘在编码时采用的是里德所罗门码,即使光盘上有擦痕也不会有多大影响。

从奖金期望值的角度看,买彩票几乎在所有情况下都是错误的选择。

米尔顿·弗里德曼与伦纳德·萨维奇给出的一个解释得到了普遍认可。他们认为,彩票玩家遵循的是一种不规则的效用曲线,该曲线表明人们在买彩票时考虑的是阶级地位,而不是数量多少。如果你是中产阶级,每周在彩票上投入5美元并且没有中奖,那么这个决策会让你损失一点儿钱,但是不会改变你的阶级地位。而且,尽管你损失了一点儿钱,但是这个效用与零非常接近。不过,一旦中奖,就会让你步入一个新的社会阶层。

我们甚至根本不需要费力地开展理论研究,就可以给出一个最简单的解释:无论输赢,买彩票都可以给我们带来一些乐趣。

对于大多数人而言,经营企业是胜算不高的赌博。

如果经营企业,我们将会面临三种结果:一是赚大钱,这个概率非常非常小;二是捉襟见肘、勉强维持生计,这个概率比较大;三是亏本倒闭,这个概率最大。对很大一部分潜在的企业家而言,如果对这些数据加以处理,就像买彩票一样,收益期望值也小于零。

即使在存活下来的企业中,企业主挣的钱通常也不会很多,如果他们去某个公司上班、领薪水,绝大多数情况下收入会更高。

企业经营的效用与购买彩票的效用一样,不仅仅是通过收益期望值来衡量的。实现梦想的行为本身,甚至这方面的尝试,就是一种回报。

到1922年,名列前茅的服装店已经丧失了大部分优势,它们的经营状况虽然仍优于绝大多数普通服装店,但已经不再遥遥领先了。然而,排名靠后(经营状况糟糕)的服装店却发生了相反的变化,它们的业绩有所提高,正在不断接近平均水平。

西克里斯特发现,所有行业的情况都类似。业绩优秀的五金店会衰退到平庸状态,杂货店也同样如此。

父母较矮时,情况则正好相反,虽然孩子也比较矮,但是不会比他们的父母矮。现在,人们把高尔顿所发现的这个现象叫作“回归平均值”(regression to the mean),他收集的数据表明这个现象毫无疑问是存在的。

生活中随时间产生起伏变化的任何东西,几乎都会受到回归效应的影响。

一位作家在他的第一部小说大获成功之后,或者一个流行乐队在其第一张专辑销售火爆之后,第二部作品受欢迎的程度往往会下降,

球员们之所以能登上本垒打大赛的赛场,是因为他们在赛季之初表现突出。由于回归效应,他们在赛季后期打出的本垒打次数肯定会减少。

人们在少年犯中随机选择了一部分人,让他们参与“现身说法”计划,然后同那些没有参与该计划的少年犯进行比较,以此来检验这项计划的效果。结果,研究人员发现,该计划竟然导致反社会行为有所增加。或许,给这项计划取名“以身试法”更合适。

少年犯不是研究人员随机选择的研究对象,他们之所以被选中,是因为他们是同类人群中表现最差的。根据回归理论,如果这一年表现最恶劣,那么下一年仍然有可能会惹麻烦,但是概率并没有人们想象的那么大。

高尔顿发现自己绘制的散点图表现出惊人的规律性:所有等值线都是椭圆形,一个包含另一个,且中心都在同一个点上。这幅图就像一座山峰的标准等高线图,最高点是父亲与儿子平均身高所对应的点,而这两个身高在高尔顿的散点图中出现的次数最多。其实,这座山峰就相当于棣莫弗曾经研究过的“法国警察的帽子”,只不过是三维的,用专业术语表达就是“二元正态分布”(bivariate normal distribution)。

犯错误就像一种原罪,打从一出生我们就会犯错误,而且会不断犯错误,因此,我们必须时刻保持警惕。

相关性是不可传递的。烟酸与优质胆固醇含量之间存在相关性,高含量的优质胆固醇与低心脏发病率之间存在相关性,但这并不意味着烟酸可以预防心脏病。

不存在相关性不代表没有任何关系。

相关关系与因果关系是不同的概念。

期望值并不代表我们期望发生的结果,而是指在多次做出该决定后的平均结果。

在现实生活中,与患有一种疾病的人相比,被两种疾病缠身的人更有可能住院。

柏克森悖论同样有意义。女性读者可能注意到一个问题,在与你们约会的男性对象中,相貌英俊的往往不友善,而友善的又往往其貌不扬。

坦率地讲,女性根本不会考虑与那些态度恶劣且相貌丑陋的男性约会。

女性喜欢的那些相貌丑陋的男性则位于三角形的一个小角落里,他们非常友善,否则女性的心目中根本不会有他们的位置。

美国人宁愿削减政府项目,也不愿意多缴纳各种税费,这是他们一贯的选择。

普通美国人总是希望削减对外援助,偶尔可以容忍削减福利与国防开支,而所有人都热切地希望把更多的税收投入到其他项目上。

是减少教育、医疗、交通或者退休金方面的投入,还是提高营业税、州所得税或者商业税的税率呢?所有选项都没有得到大多数人的支持。

经济学家布莱恩·卡普兰(Bryan Caplan)认为:“公众希望得到的是免费午餐,这是对这些数据最令人信服的解读。他们既希望减少政府开支,又希望政府继续履行其主要职责。”

保罗·克鲁格曼(Paul Krugman)指出:“人们希望削减开支,但是反对削减除对外援助以外的所有开支……因此,我们只能认为,共和党人得到了废除运算法则的授权。”

我们在民意调查中经常会见到这种自相矛盾的情形:我们希望削减开支,但同时我们又希望投入到所有政府开支项目中的资金都保持原有水平。

每一位投票人的政治立场都富有理性而且合乎逻辑,但是,把所有人的立场汇总起来就成了闹剧。

有47%的美国人认为平衡预算必然导致投入到政府项目中的资金减少,有38%的人则认为必须削减某些物有所值的政府项目。换言之,普通美国人不会持有既希望削减政府开支又想要保留所有政府项目的幼稚想法。

美国人认为联邦政府的很多项目没有多少价值,是在浪费纳税人的钱,因此他们非常愿意削减这些项目,以实现政府收支平衡。但问题是,在哪些是有价值的项目这个问题上,美国人没有达成一致意见。

少数服从多数”原则简单明了,看似公平,但仅在涉及两种观点时,它才能取得最佳效果。只要观点多于两种,大多数人的喜好就会有自相矛盾的地方。

人们面临(至少)三种选择:保持医疗法案不变,废止该法案,或者强化该法案。但是,每一种选择都遭到了大多数美国人的反对。

民意是根本不存在的东西,更准确地讲,只有在大多数人意见一致时民意才会存在。

如果说民意纯属子虚乌有,那么官员当选之后该如何履行职责呢?很简单,既然美国人民没有达成一致意见,官员们自行其是就可以了。

如果你是一名优秀的政治家,你就会说:“人们选择我,是希望我履行政府官员的职责,而不是研究民调数据。”

如果你是一位伟大的政治家,你就会想方设法,对不一致的民意加以利用。

遭殃的是各市与各县的官员,因为他们必须削减政府开支。这些可怜的傻瓜别无选择,只能推行大多数选民反对的政策并承担其后果,而州长却安然无恙,不会受到任何影响。预算游戏与很多活动一样,取得主导权就会占据优势。

答案是:不要选择其中任何一种方案,而是将两种方案加以综合。州长可以这样告诉公众:“我保证大家无须多缴一美分的税。我将为所有城市提供必需的设施和优质的公共服务,还不会多花纳税人的钱。” 由于州政府下拨的资金减少了,各地方政府必须在剩下的两个方案中做出选择:削减交通费用或者教育资金。

需要考虑的不是“对智力低下的囚犯处以死刑是否正确”这个问题,而是“美国人是否认为对智力低下的囚犯处以死刑是正确的做法”。这不是道德问题,而是民意问题。

1989~2002年,美国宪法没有任何与此相关的改动,为什么当初的死刑判决符合宪法,而13年之后又不符合宪法了呢?答案就在美国宪法“第八修正案”里。第八修正案禁止美国各州施行“残酷和非常的刑罚”,但是,一直以来,“残酷”与“非常”的确切含义在法律界引起了激烈的争论。

残酷”指的是开国先驱们心目中的“残酷”还是我们心目中的“残酷”?判断是否“非常”应采用当时的标准还是现在的标准?

无关选项的独立性”(independence of irrelevant alternatives),就适用于这种情况。根据这个法则,无论你是多头绒泡菌、人还是民主国家,如果要在方案甲与方案乙之间做选择,第三个方案丙的出现都不会影响你对甲和乙的倾向性。

投票活动往往会导致自相矛盾的结果——多数人的愿望会落空,无关的第三方却能决定最后的答案。1992年的受益者是克林顿,2000年是小布什,而这些结果背后的数学原理是永恒不变的,即“选民的真实意图”难以捉摸。

在戈尔与小布什这两位候选人中,倾向于前者的选民比后者多。选举制度为什么无法了解这个信息呢?这是因为把选票投给纳德的选民没有办法表达出他们对戈尔的支持程度超过小布什。

“非对称性支配效应”(asymmetric domination effect),其他生物也会受到该效应的影响。

如果你是一位正在寻找真爱的单身汉,那么,在考虑与哪位朋友一起去城里赴心仪对象的约会时,应该选择条件与你相似但略微逊色于你的那位。

个人之所以不理性,也许是因为他们并不是真正的个体。每个人都是一个小国家,我们要做的就是尽可能地处理各种争端、做出妥协,而最后得到的未必都是合理的结果。

像多头绒泡菌一样,我们也有可能小错不断,但却能做到大错不犯。民主必然包含各种杂音,但是的确能产生某种效果。

实时复选法——澳大利亚人称之为“偏好投票法”(preferential voting)——明显具有更大的吸引力。喜欢纳德的人无须担心自己的投票会对他们最不喜欢的候选人有利,纳德也可以放心地参选,无须担心自己的参选会让他最不喜欢的候选人占便宜。

传统的美国选举制度:赖特获胜 实时复选法:基斯获胜 两两对决法:蒙特尔获胜

孔多塞坚持认为女性也应当享有那些人们广泛议论的人权,在当时这个观点几乎是孔多塞的一家之言,但这也是他做出的积极贡献之一。

孔多塞从来没有想到所谓的民意根本就不存在。

计票次数越多,结果应该越准确,但最高法院认为,这不是选举的最高目标。他们认为,只有一部分县重新计票,这对那些没有重新计票的县是不公正的。

拉马努金是个特例,人们经常讲述他的故事,正是因为他不具有代表性。

上大学时,我确信那些学习奥数的我的竞争对手将成为伟大的数学家。然而,事实跟我预想的不完全一样。

现在我身边的这些数学家,他们13岁时在数学上还没有什么突出的表现。

如果他们在中学时就放弃了数学学习,还会取得今日的成就吗?

马克·吐温有一句话说得非常好:“电报、蒸汽机、留声机、电话等重要发明,往往需要成千上万人的努力,但得到荣誉的总是取得最后胜利的那个人,而其他人则被忘得一干二净。”

1948年,哥德尔在准备美国公民入籍考试时研究了美国宪法,结果发现其中存在自相矛盾的地方,有可能导致法西斯独裁者以完全符合宪法的方式控制美国,他对此深感不安。哥德尔的朋友爱因斯坦和奥斯卡·摩根斯特恩都告诫他在参加考试时不要提这个问题。

局部细节的不一致性在整个模型中随处可见,不同参数的不确定性又相互影响。

我没有办法确定哪种结果是正确的。 但是,那位研究人员不愿意接受这样的结果。他付给我钱,希望我能给他一个具体的数字。他再三向我解释:“我知道这里存在不确定性,所有的医学研究都有不确定性,我知道这个特点,但是,你还是要告诉我你认为哪个结果更有可能是正确的。”

“因为行为的结果是无法确定的”这句话变成了我的口头禅。

正确答案只有一个:“这两个人都有可能获胜,但是奥巴马当选的可能性要高得多。”

哲学家奎因(Quine)指出:“所谓信念,就是相信某个东西是正确的。因此,理性的人相信他的每一个信念都是正确的;然而根据经验,他又会认为自己的某个信念(但是无法确定是哪一个)有可能是错误的。简言之,理性的人会认为自己的每一个信念都是正确的,但又有一些信念是错误的。”

所有的行为,都充满了不确定性。

不可过于计较精确性。

法官与数学家的区别在于:法官必须想方设法假装自己知道结果,而数学家则可以肆无忌惮地说出真相。

本杰明·富兰克林(Benjamin Franklin)对他在费城的知识分子圈成员托马斯·戈弗雷(Thomas Godfrey)的描述十分犀利:“他的知识面非常狭窄,而且他很难相处。同我认识的大多数伟大的数学家一样,他对人们说的每一句话都非常较真,在小事上吹毛求疵,和他交谈总是让人十分头疼。”

事实上,人们经常建议(我在攻读博士学位时,导师就是这样建议我的,可能他的导师当初也给了他同样的建议),当为一个定理绞尽脑汁时,我们应该在白天证明它是正确的,在晚上证明它是错误的。

如果我们试图证明某个正确的观点或想法是错误的,那么我们必将失败。我们习惯于认为失败不是一件好事,但并不是所有的失败都是坏事,因为我们也可以从失败中学到一些东西。

1936年,菲茨杰拉德在散文《崩溃》(The Crack-Up)中描述了自己处于破产、无助的状态,表明了他的态度——相互矛盾的理念可以并存于头脑之中。当时,在他思想中相互矛盾的两个理念是“努力奋斗的徒劳感与奋力拼搏的必要性”。

曾经尝试过,也失败过,但是没关系,再尝试、再失败,每一次失败都是进步。

本书的成功问世,证明我的代理人杰伊·曼德尔非常专业,指导有方。多年来,他总是耐心地询问我是否准备写点儿什么,在我终于给出肯定的回答之后,他又帮助我不断完善“我希望发出振聋发聩的声音,告诉人们数学的重要性”这个想法,并把它变成了一本名副其实的书。

Written on April 24, 2023