信号与噪声

莎士比亚时期,掌控自身命运看似已成为人们思想意识的一部分,但要做到这一点却很难,所以那些挑战命运的人总是遍体鳞伤,直至死去。

罗伯特·索洛曾经在 1987 年写道:“计算机无处不在,可生产统计中却不见其身影。

2005 年,一位土生土长的雅典人,医学研究者约翰·P·埃尼迪斯,发表了一篇颇具争议性的论文,题为“为什么大多数发表的研究成果都是骗人的”。

大多数成果在实际生活中很可能是毫无用处的。德国拜耳制药公司最近证实了埃尼迪斯的这个推断,他们通过实验亲自对那些医学期刊中提到的积极研究成果进行验证,但发现其中近 2/3 的医学假设根本不能成立。

克罗尔对我说:“评级机构的人并不傻,他们对后果一清二楚。我想他们只是不想让音乐停止罢了。”

政府的一次调查公开了穆迪两名老员工的即时信息交流记录,其中一位员工说,即使一种证券是“一群牛设计的”,穆迪也愿意评估它。

不确定性是指难以度量的风险。

希勒对荷兰与挪威等几个国家几百年来的数据进行了研究,结果发现,一旦房地产行业的发展超出人们的负担能力,房地产市场必将崩盘。

截至 2007 年,美国的中产阶层家庭的财产中有超过 65%都花在自家的房子上了。

乔治·阿克尔洛夫告诉我说:“如果有人在市场上竭力向你推销一款你完全不了解的产品,你就该想到他们在向你推销柠檬(没用的东西或者质次价高的产品)。”

金融危机导致的失业问题通常都会持续 4~6 年。

在信息时代我们面临的一个重大挑战,就是全球的知识总量在增加,而我们实际掌握的知识和自认为掌握的知识之间的鸿沟却越来越宽。

表现不佳的专家往往是被媒体引用预测言论最多的那些人。泰特罗克发现,如果一位专家接受新闻媒体的采访越多,他的预测就可能越不准确。

狐狸型专家。他们可能会很谦逊地说自己的能力有限,但是成功的把握其实很大。

狐狸型专家的经验越丰富,预测就越准确,而刺猬型专家则恰恰相反:他们获得的额外信息越多,表现得就越糟糕。

过度拟合代表了双重霉运:过度拟合的模型表面上来看比较好,但其实际性能却很糟糕。

美国国家气象局明显是刻意对公众隐瞒了预测中的不确定性,只是一味地强调水深将达 14.9 米这一预测结果。

负责此次洪灾预测工作的预测者后来告诉那些研究人员,如果自己的观点中传达出任何含有不确定性的信息,他们都担心公众会因此对预测失去信心。

哈祖斯对我说:“真正具有预测性的变量几乎不存在,想要弄明白哪些是因果关系,哪些属于相关性,是很困难的。”

正如 1976 年诺贝尔经济学奖获得者罗伯特·卢卡斯指出的那样,经济模型以历史数据作为依据,这些数据一部分来自方针决策,而这些决策在当时是适用的。

只知道现在的政策制定者想要做什么是不够的,还需要对尼克松政府执政期间的财政和货币政策有所了解。

由伦敦政治经济学院教授提出的“古德哈特定律”认为,政策制定者一旦锁定一个特定变量,这个变量就会逐渐失去其作为经济指标的价值。

哈祖斯告诉我:“我认为人们绝对有这样的倾向,急切地希望事情能按照自己希望的方式发展下去。”

现实中的管理人员所做的大多是管理团队和维持项目计划免遭终结等工作。

若预测会自动实现,这种情况便可称为自我实现预测,或自我实现预言。

自我否定预测是指预测会自我破坏。

所有的模型都是错误的,但是其中有些是有用的。

成功的“赌客”以及任何领域中成功的预测者,从来不会以稳赚不赔的心态、无懈可击的理论和极其准确的尺度去看待未来,这些都是失败者的幻想,是过度自信的弊病。

像卡斯帕罗夫这样的伟大棋手从不会自欺欺人地认为自己能够计算出所有的可能性。这正是大师级棋手和业余棋手的差别所在。

业余棋手下棋时总想找到完美的一招,寻求未果便会倍感沮丧,往往举棋不定,寸步难行。

本书的核心前提就是,若想做出更准确的预测,就必须承认我们的判断是不可靠的。

到 2010 年,科技公司的产值贡献只占所有经济活动总量的 7%。

股票经纪人将股票抛出,但是股价却涨了。这个情况对他来说不啻于一场灾难。这不仅使得同行们的操盘表现大大超过了他,而当初他竟还伸长脖子大呼同行们是傻子。

股票经纪人买入股票,但股市却崩盘了。这种情况真是不妙:他让公司损失了一大笔钱,自己也拿不到大笔佣金,不能买新款雷克萨斯汽车了。但他并不是“孤军奋战”,他的同事大多数都犯了同样的错误。

如果我是这位股票经纪人,当股市崩盘的概率为 20%的时候,我绝不会将股票抛出。甚至当这个概率达到 50%的时候,我也不会抛出股票。

在实践中,借给你股票的投资者在认为你存在信用风险时,能够随时要回股票。这也意味着他能够在股价有利于他自己时选择退出交易,因为股市中存在这么个大问题,它使得被高估的股价在恢复到较为公平的价格水平前,会被更严重地高估。

股市中存在着很多不对称的问题,比如股市泡沫很容易觉察但很难击破。

事实上,有效市场假说存在着自我否定的含义。如果所有投资者都相信这个理论——市场是无法战胜的,他们就不可能从交易中获利,就没有人愿意进行交易,市场也就不存在了。

美国“盖洛普咨询公司”和其他一些民调机构会定期对美国民众进行调查,询问他们是否认为现在是投资股票的好时机。从历史数据来看,该民调结果和股票走势有着很密切的关系,但是负相关的关系。

盖洛普的记录显示,2000 年 1 月时民调结果达到了最高值,有 67%的美国民众认为这时是投资股市的好时机。然而,仅仅两个月后,纳斯达克综合指数及其他股指就开始暴跌。

1990 年 2 月,只有 26%的美国民众认为此时投资股市是正确的,结果此后的 10 年,标准普尔 500 指数几乎增加了 3 倍。

有些事是已知的已知,即我们清楚自己知道它。有些事是已知的未知,即我们清楚自己不知道它。有些事是未知的未知,即我们并不清楚自己不知道它。 唐纳德·拉姆斯菲尔德

早在古腾堡发明印刷机之前,书籍就已经存在了,但当时书的数量和读书的人都很少,书籍只是贵族阶层的奢侈品。因为抄写员每次只能抄写一份副本,复制一份原稿的费用大约是每 5 页 1 弗洛林(一种金币,1 弗洛林约合 200 美元),因此像你现在读的这本书,在当时可能要花费 20 000 美元才能得到。

要想阻止以文字记录的知识的不断减少,就需要付出巨大的努力,因为书籍腐烂的速度远远大于其生成的速度。只有几个版本的《圣经》和少量的哲学论述——比如柏拉图和亚里士多德的文章——被保留了下来,其他那些数不清的智慧,由于缺乏记载动机,都遗失在那个年代了。

《圣经·传道书》中有一句唯美的诗句:“日光之下无新事”,可事实却并非如此,之所以说“无新事”,并不是因为每件事都已经被发掘出来了,而是因为所有事情都将被遗忘。

印刷错误大量出现,那本被叫作《邪恶圣经》的书便是如此,这本书犯了史上最严重的印刷错误——《十诫》中的“不可奸淫”误印成“应当奸淫”。

信息的增长速度远远超过了人们处理信息和分辨信息的速度。共享信息的不断增长反而加速了民族和宗教的孤立进程,其速度之快不禁让人瞠目结舌

莎士比亚时期,掌控自身命运看似已成为人们思想意识的一部分,但要做到这一点却很难,所以那些挑战命运的人总是遍体鳞伤,直至死去。

莎士比亚借西塞罗的话警示我们,“(可是)人们照着自己的意思解释一切事物的原因,实际上却和这些事物本身的目的完全相反”。

工业革命的重大意义难以尽数。纵观人类社会的历史进程,经济增长的速度曾经为年均 0.1%。

罗伯特·索洛曾经在 1987 年写道:“计算机无处不在,可生产统计中却不见其身影。

如果让我们用一个特点来定义美国人——一个令其与众不同的特质——那就是美国人对卡修斯精神的信仰:我们的命运由我们自己主宰。

福岛核反应堆的设计可以抵抗 8.6 级地震,因为一些地震学家称不可能发生更高级别的地震。但是,2011 年 3 月日本却发生了 9.1 级的特大地震。

2005 年,一位土生土长的雅典人,医学研究者约翰·P·埃尼迪斯,发表了一篇颇具争议性的论文,题为“为什么大多数发表的研究成果都是骗人的”。该文对那些行业期刊中刊载的积极的研究成果进行了研究(这些成果认为那些在实验室实验中得到验证的医学假设堪称成功预测),认为大多数成果在实际生活中很可能是毫无用处的。德国拜耳制药公司最近证实了埃尼迪斯的这个推断,他们通过实验亲自对那些医学期刊中提到的积极研究成果进行验证,但发现其中近 2/3 的医学假设根本不能成立。

进化来的本能有时会让我们去寻找原本不存在的模式,“人们一直都在努力从随机噪声(即无规律的状况)中发现模式”。

如果信息的数量以每天 250 兆亿字节的速度增长,其中有用的信息肯定接近于零。大部分信息都只是噪声而已,而且噪声的增长速度要比信号快得多。

我们喜欢对事物做出预测,而我们的预言却总是出错。

我们永远都不可能做出完全客观的预测,因为这些预测总会带有主观色彩。

要做出准确的预测,首要的前提就是坚信客观真理的存在,并且执着地追寻它。而预测者的另一个承诺,就是要认识到他无法穷尽对客观真理的认知。

我们拥有的信息太多,甚至多到无从下手,但有用的信息却寥寥无几。

我们以为自己需要信息,但其实我们真正需要的是知识。

信号是真相,噪声却使我们离真相越来越远。

在美国国会听证会上,评级机构的负责人都以“运气不佳”为托词意图逃避责任,谴责房地产泡沫带来了此次意外。

早在 2000 年的时候,耶鲁大学经济学教授罗伯特·希勒在其著作《非理性繁荣》中就注意到了房地产泡沫的苗头。

保罗·克鲁格曼在 2005 年 8 月也撰文记述了这次房地产泡沫及其必然后果。后来,克鲁格曼告诉我:“房地产泡沫是内置在经济系统中的。房市崩盘并非黑天鹅,而是房间里的大象,看上去显而易见却总是被人们忽略。”

普通的美国民众对这个问题也很关切。2004 年 1 月至 2005 年夏天,在短短一年半的时间里,“房地产泡沫”这一词条的谷歌搜索量迅速增加了近 10 倍。

2001 年的新闻报道中出现“房地产泡沫”这一词条的只有 8 条新闻,而到了 2005 年,相关新闻的数量已经跃升至 3 447 条,这一词条在知名的报纸期刊上出现的频率也高达日均 10 次。

克罗尔对我说:“评级机构的人并不傻,他们对后果一清二楚。我想他们只是不想让音乐停止罢了。”

评级机构一直都没有大批量地下调住房抵押贷款证券的信用级别,直到 2007 年这些问题凸显出来,房屋止赎率也已经上涨了 1 倍,此时评级机构才不得不着手处理这些问题。

政府的一次调查公开了穆迪两名老员工的即时信息交流记录,其中一位员工说,即使一种证券是“一群牛设计的”,穆迪也愿意评估它。

对威胁自己的风险,人类拥有一种超凡的能力,那就是对其视而不见,好像这么做,风险就会自动消失。

事实上,标准普尔公司十分清楚可能会出现房地产泡沫问题,但它们给出的结论却是,这次泡沫没什么大不了的。

与上述假设截然相反的另一种假设是,5 项贷款之间并非完全独立,而是彼此休戚相关,要么 5 项同时违约,要么都不违约。

穆迪公司对违约率所做出的 50%的调整,就好比是只涂了层防晒霜就告诉大家这样可以防核辐射一样,根本不足以应对这一严重的问题。

实际上,抵押贷款的违约率要比评级公司宣称的高出近 200 倍,这就意味着它们的预测模式偏离实际数据的概率高达 20 000%。

不确定性是指难以度量的风险。

“风险”一词由经济学家弗兰克·H·奈特于 1921 年第一次明确提出,我们可以为其定价。

整场金融危机的悲剧可以分为 3 幕。

第一幕:房地产泡沫

第二次世界大战后的几年,美国人的居住格局发生了巨大变化。美国人的生活从第二次世界大战前的过度储蓄转变为战后的消费激增,人们纷纷要求拓展居住空间。

21 世纪初的几年内,全美存款率降至历史最低点,某些年份甚至低到只有 1%多一点。但是,得到抵押贷款却比从前任何时候都容易。

希勒对荷兰与挪威等几个国家几百年来的数据进行了研究,结果发现,一旦房地产行业的发展超出人们的负担能力,房地产市场必将崩盘。

2003 年,凯斯和希勒负责的一项调查发现,许多业主希望他们的房产每年能增值 13%。

希勒还发现另一个导致房地产泡沫的重要证据:民众购买房屋时对这项投资可能带来的回报,总会怀着不切实际的期望

2008 年 2 月,美国国会通过一项法案,希望通过大幅度增强房利美和房地美的放贷能力来刺激住房销量。但事与愿违,房价下跌的趋势无法逆转,2008 年住房销量下跌 20%。

第二幕:负债经营

2007 年 12 月,《华尔街日报》预测版面的几位经济学家预测,2008 年经济衰退的可能性只有 38%。这一预测之所以令人印象深刻,是因为随后的数据显示,当时经济已经开始衰退了。

截至 2007 年,美国的中产阶层家庭的财产中有超过 65%都花在自家的房子上了。

2007 年,雷曼兄弟的负债率约为 33∶1,即 1 美元的资本要执行 33 美元承担的财政职能。这就意味着,如果雷曼兄弟的证券投资组合的价值只下降 3%~4%,公司拥有的资产净值就会变成负数,濒临破产。

乔治·阿克尔洛夫告诉我说:“如果有人在市场上竭力向你推销一款你完全不了解的产品,你就该想到他们在向你推销柠檬(没用的东西或者质次价高的产品)。”

信息不对称将导致市场瘟疫,商品质量会下降,市场将充斥着非法的卖家和急切且轻信的买家。

债券市场本来期望评级机构是《周六夜现场》中的戴比·唐纳,能多带来点“负面”消息,但评级机构俨然成了受人欢迎的美国演员小罗伯特·唐尼,左右逢源。

幕间休息:从贪婪到恐惧

第三幕:这次还是犯了同样的错误

美国经济学家卡门·莱因哈特和肯尼斯·罗格夫为了撰写《这次不一样:800 年金融危机史》一书,研读了大量金融史资料,他们发现,数次金融危机导致的失业问题通常都会持续 4~6 年。

距离现在比较近的几次金融危机,他发现,经历这些危机的 15 个国家中,有 10 个国家的就业率始终都无法恢复到危机前的水平。

美国的失业率仍持续上升,到 2009 年 7 月失业率升至 9.5%,同年 10 月更是达到令人咋舌的 10.1%,这比白宫之前预测的“没有刺激计划”的后果还要严重。

2009 年 2 月,在按政党画线的投票中,美国国会通过了这一刺激计划,但是美国的失业率仍持续上升,到 2009 年 7 月失业率升至 9.5%,同年 10 月更是达到令人咋舌的 10.1%,这比白宫之前预测的“没有刺激计划”的后果还要严重。

保罗·克鲁格曼一开始就认为这项刺激计划的投资明显不足,他认为此次刺激计划的失败证明,白宫过分低估了个人及企业需求的降低幅度。

也许白宫犯下的更不可宽恕的错误是,他们做出这样一个看似很精确的预测,却没有告诉人们这个预测也有可能会出错。

在信息时代我们面临的一个重大挑战,就是全球的知识总量在增加,而我们实际掌握的知识和自认为掌握的知识之间的鸿沟却越来越宽。

2008 年 9 月 15 日,雷曼兄弟宣布破产,引发了自 20 世纪 30 年代大萧条时期之后最严重的经济衰退,正是从那天起,奥巴马的选票数几乎在所有的美国投票站都领先麦凯恩。

赌博市场虽然对美国总统大选结果的估计稍显模棱两可,但对奥巴马获选的支持率预测也达到了 7∶1。

1988 年 11 月 16 日,爱沙尼亚共和国(面积同美国缅因州相仿)议会宣布脱离苏联独立。

如果说苏联的衰亡是有迹可循的,是可以预测到的,然而几乎所有主流的政治学家都没有察觉到这一点。即使有,当时也会被当成笑料

泰特罗克发现,那些政治专家很难预测到苏联解体,因为既要预测到政权的衰亡,又要找到其衰亡的原因,这就需要进行预测的人将不同立场的观点论据穿插在一起。这些观点本身没有什么内在矛盾,但通常是由身处两个不同政治阵营的人发出的,而坚定地站在某一个思想阵营的学者则不可能同时接受两种思想。

如果戈尔巴乔夫当初选择做会计或是诗人而不是选择踏入政坛,苏联政权也许至少几年内还不至于垮台

1990 年,美国中央情报局估计——相当不准确的估计——苏联的国民生产总值约为美国的 1/2(按人均水平计算,与今天的韩国和葡萄牙这类稳定的民主国家的水平相当)

实际上,最新的证据表明,由于长期陷于阿富汗战争的泥潭,且中央政府对各类社会问题疏于管理,苏联的国内生产总值比美国中央情报局提供的数据还要低约 1 万亿美元,而且每年国内生产总值缩减的比例都会达到 5%,通货膨胀率也高达两位数。

泰特罗克的结论招来了强烈谴责。他的调查中涉及的那些专家——无论职业、阅历或者研究领域——所作的各项预测的准确率跟碰运气差不多,对未来的政治事件进行预测时,他们预测的准确程度甚至不及那些尚不成熟的统计方法计算的准确度。

表现不佳的专家往往是被媒体引用预测言论最多的那些人。泰特罗克发现,如果一位专家接受新闻媒体的采访越多,他的预测就可能越不准确。

伯林则是借鉴了希腊诗人阿基罗库斯的作品才想到了这一题目:“狐狸千伎百俩而有尽,刺猬凭一技之长而无穷”。

狐狸属于一种好斗的人,他们认为“千伎百俩而有尽”,解决问题有许多方法。他们对于琐碎、不确定、复杂或是有分歧的意见更加有耐心。

刺猬属于 A 型性格的人,他们相信“凭一技之长而无穷”,认为自己掌控着世间真理,认为自己就是万物的法则,切实保障着社会的运行。

泰特罗克发现,作预测时,狐狸型专家比刺猬型专家考虑得更周全,比如在苏联的问题上,他们的预测就更准确一些。对苏联问题进行预测时,他们没有把这个国家视为一个意识形态符号,既不认为苏联是“邪恶帝国”,也不认为苏联是马克思主义经济体系中一个相对成功(或是举世瞩目)的案例。他们只是客观地看待这个国家:一个濒临瓦解的国家,一个日渐式微的国家。

曾任美国前总统克林顿顾问的迪克·莫里斯现在是《福克斯新闻》的评论员,他是典型的刺猬型专家,他的策略就是抓住一切机会做出惹人注目的预测。

高调、夸大的刺猬型预测更有可能使你成为电视中的公众人物

但是,莫里斯思维敏捷,说话风趣,非常善于推销自己——他在《福克斯新闻》中有固定的栏目,他所著图书的销量也高达几十万册。

狐狸型专家认为,许多问题难以预测,所以我们应该对这些不确定性进行解释。

狐狸型专家。他们可能会很谦逊地说自己的能力有限,但是成功的把握其实很大。

泰特罗克还有一些更重要的发现,其中之一便是,狐狸型专家的经验越丰富,预测就越准确,而刺猬型专家则恰恰相反:他们获得的额外信息越多,表现得就越糟糕。

刺猬型专家掌握的事实越多,他们以自己的方式改变且操纵事实的机会就越多,而这些方式往往会强化他们的个人偏见。如果你让一个忧郁症患者待在一个可以上网的黑暗房间里,就会出现类似的情况。

刺猬型专家一旦掌握大量信息就会编一些故事,这些故事甚至比真实世界发生的事情更有条理、更加有序,有主角和反派、胜者和败者、高潮和结局,通常以大团圆结局收场。

如果确定昨天的预测是错误的,那就没必要坚持了。经济学家约翰·梅纳德·凯恩斯有一句著名的论断:“当实际情况发生改变时,我的想法也会随之改变,你是怎么做的呢?”

如果确定昨天的预测是错误的,那就没必要坚持了。

泰特罗克曾经对我说:“狐狸型专家通常会独立思考问题,而刺猬型专家则习惯与别人共同商讨问题。”

狐狸型专家已经培养出一种仿效集体决策过程的能力。他们不再咨询整个专家组,而是不停地向自己发问。通常这就意味着他们需要将很多不同类型的信息集合起来——就像一组各持己见的人真正要做的那样——他们会客观地对待所有信息,而绝不会把某一条信息当成金科玉律。

“客观”有时被认为是“定量”的同义词,其实不然。它的实际意义是超越我们的个人喜好和偏见,去寻找问题的真相。

在这个世界上,纯粹的客观性是求之而不得的。

狐狸型专家认识到了人类在预测世界进程时所作判断的局限性。认识到这些局限,才能做出更准确的预测。

詹姆斯发现,在二十八九岁之前,大多数球员的技术水平都会持续提高,但之后通常会开始走下坡路,三十五六岁时尤其严重。

每位棒球队员的技术水平都处于一种不断变化的状态,预测的挑战也正在于此。

奥运会体操运动员的运动巅峰期是十几岁,诗人的黄金时代是二十几岁,国际象棋选手的最佳比赛年龄是三十几岁,应用经济学家在四十几岁时成就辉煌,财富 500 强首席执行官的平均年龄为 55 岁。

一个棒球运动员状态最好的年龄是 27 岁。

就竞争的激烈程度而言,几乎没有哪种职业运动能与棒球匹敌。数十万名业余球员,数千名职业球员,只有 750 人能在指定时间加入美国棒球大联盟,而这 750 人中能入选全明星队的则更是少之又少,只有几十人。

美国经济持续发展的连锁反应事件,正是其难以预测的原因之一。

宏观经济中的微小变化极有可能导致严重的后果。

纳金推迟下达撤离命令是因为害怕纠纷——如果因此搅了旅馆的生意,那么旅馆经营者可能会控告他。

如果你让上百人设法做出地震预测,而每年又有数百场地震发生,那必然有人会预测对一次。

过度拟合代表了双重霉运:过度拟合的模型表面上来看比较好,但其实际性能却很糟糕。

因为前一种因素——其表面效果不错,而且自称可以做出非常准确并且新闻价值很高的预测,比其他应用技术都先进,所以,这类模型更吸引人,更容易在学术期刊上得到推介,也更容易被推销给客户,从而将其他可靠的模型排挤出市场。

将噪声误认为信号的倾向,有时会给现实世界带来极可怕的后果。

福岛核反应堆是按照可抵御 8.6 级地震的标准设计的,无法承受震级高达 9.1 级的地震。

9.1 级地震在全世界都很少见,没人能确切地预测到这样的地震会发生在哪个 10 年里,更不用说具体的日期了。而在日本,一些科学家和中央计划员却排除了近期发生地震的可能性。这一点就反映了日本的地震预测模型是过度拟合模型。

预测者的首要职责就是忠于真理。

更常见的情形是这些预测甚至连已经开始且正在进行中的经济衰退都无法“预言”。最近的 3 次经济衰退——1990 年、2001 年和 2007 年经济衰退——都是这样的情形,衰退明明已经开始,但大部分经济学家却不乐意承认,直到最后才确认这一点。

与其他大多数学科的预测者一样,经济预测者将不确定性视作仇敌——威胁其名誉的仇敌。

美国国家气象局明显是刻意对公众隐瞒了预测中的不确定性,只是一味地强调水深将达 14.9 米这一预测结果。

负责此次洪灾预测工作的预测者后来告诉那些研究人员,如果自己的观点中传达出任何含有不确定性的信息,他们都担心公众会因此对预测失去信心。

有这样一个被引用了无数次的笑话:一位统计学家趟过一条平均水位不足 1 米深的河时,竟被淹死了。

20 世纪 90 年代,在全世界 60 次经济衰退中,经济学家提前一年预测到的衰退只有两次。

这样的做法已成为预测行业的行规:那些专家既不擅长诚实地描述预测中的不确定性,对这种做法也不大感兴趣。过度自信的预测体现出的这种特性在其他许多领域也显露出来,包括医学研究、政治科学、金融学以及心理学。

相关的两个经济变量未必互为因果

在哈祖斯看来,经济预测者面临着三大基本挑战。第一,单纯依靠经济统计数据,很难判断起因和结果。第二,经济始终都在变化,某一经济周期的经济运行状况无法被用来解释未来经济的发展。第三,经济学家以往的预测如此糟糕,那么他们作预测时所参照的数据也好不到哪里去。

第二次世界大战之后只出现了 11 次经济衰退的情况,如果一个统计模型试图解释这 11 次衰退带来的后果,就必须从 400 万个数据中选择数据,由此得出的许多相关性都将会带有欺骗性。(这是过度拟合的又一个经典例子——将噪声误认为是信号

美国政府每年公布的数据,与经济指标直接相关的有 4.5 万个,而私人数据提供者要追踪高达 400 万个统计数据。

从 1967 年的第一届超级杯大赛到 1997 年的第 31 届超级杯大赛,当来自原美国国家橄榄球联盟(NFL)的队伍赢得比赛时,那么股市就会平均上涨 14%,而如果是来自原美国职业橄榄球联盟的队伍赢得比赛时,那么股市就会平均下跌 10%。 1997 年之前的 31 年里,有 28 年该指标都正确地“预测”了股市的走向。

哈祖斯对我说:“真正具有预测性的变量几乎不存在,想要弄明白哪些是因果关系,哪些属于相关性,是很困难的。”

相关性并不是指因果关系。

消费者信心是另一个捉摸不定的变量,总会变来变去。有时,消费者是最先发现经济预警信号的群体之一,而有时他们又是最后觉察到经济复苏的群体之一,因为一直以来,经济衰退实际上早就结束了,但公众却认为经济仍然处于衰退期。

正如 1976 年诺贝尔经济学奖获得者罗伯特·卢卡斯指出的那样,经济模型以历史数据作为依据,这些数据一部分来自方针决策,而这些决策在当时是适用的。

只知道现在的政策制定者想要做什么是不够的,还需要对尼克松政府执政期间的财政和货币政策有所了解。

由伦敦政治经济学院教授提出的“古德哈特定律”认为,政策制定者一旦锁定一个特定变量,这个变量就会逐渐失去其作为经济指标的价值。

观察者效应(常被误认为海森堡的不确定性原理):一旦我们开始测量某物,它的行为就会发生改变。大多数统计模型都是依托这一概念建立的,输入和输出分别是自变量和因变量,彼此之间泾渭分明,但在经济领域中,两者却混在一起、乱作一团。

萨克斯告诉我,“我们低估了全球变化对美国变化的影响。国际上的工作岗位都转移到了中国,新兴市场确实动摇了美国经济。”

1983~2006 年这段时间尤为明显,衰退期只占整个时间段的 3%,所以这一时期有时也被称作“大缓和”时期,是经济长期繁荣期的一个子集。但是,经济增长依靠的大多是激增的政府和消费者债务,还有各种资产价格泡沫。

20 世纪 80 年代,日本经济的年增长率为 5%,而此后的增长率仅为 1%。

从历史角度来看,“大缓和”时期不过是非主流现象罢了。

为了做出准确的预测,FOMC 参考了“大缓和”时期的数据。FOMC 成员对一篇记录了 1986~2006 年经济预测表现的论文有些过度依赖。

哈祖斯说:“经济预测者为什么不公开预测区间呢?因为他们怕出丑。我认为就是这个原因,他们怕出丑。”

不仅经济预测中存在着不确定性,经济变量本身也具有不确定性。

在经济预测中,初始数据的质量通常都非常差。

负债经营的程度会使问题复杂化,导致信贷市场和金融业出现更大面积的瘫痪。所以说,这样的打击足以引发严重的经济衰退。

哈祖斯告诉我:“我认为人们绝对有这样的倾向,急切地希望事情能按照自己希望的方式发展下去。”

正如罗伯特·卢卡斯所言,经济预测与经济政策之间的界限十分模糊,一个不准确的预测可能会使现实中的经济状况变得更加糟糕。

在位于加利福尼亚芒廷维尤的谷歌总部,公司的首席经济学家哈尔·瓦里安对我说:“在我们看来,是否领取了失业保险中的最初赔偿,这一指标能够很准确地预测失业率,也能准确地预测经济活动。

现实中的管理人员所做的大多是管理团队和维持项目计划免遭终结等工作。

在预测中表现出的自信并不能代表预测的准确度,相反,这两者经常成反比。

流感并不足以引起重视,每年一月和二月,美国都会有几千万人患上流感,但死亡病例却微乎其微。

1918~1920 年的西班牙流感,这场流感导致全世界 1/3 的人感染,5 千万人丧生,其中包括 67.5 万名美国人。

H1N1 病毒曾导致美国现代史上最严重的流行疾病:1918~1920 年的西班牙流感,这场流感导致全世界 1/3 的人感染,5 千万人丧生,其中包括 67.5 万名美国人。

纵观美国历史,凡美国政府实施全面注射疫苗时总会引起过度恐慌。

2009 年 H1N1 流感爆发时,科学家们一开始并没有识别出这种病毒,而在检测结果出来之后,他们又过高地估计了这一病毒的危害。

人们又一次高估了 H1N1 的致命率

仅中国现存猪的数量就占世界数量的 1/2)

其实,H1N1 病毒致死率仅为 0.02%,并不属于异常严重的病毒,而是属于格外温和的病毒。实际上,2009 年流感病毒的死亡人数比因常见的季节性流感而死亡的人数还要少。

工业革命爆发,人口数量增长率直线上升。

不准确的数据也是导致 2009 年 H1N1 病毒预测失败的原因之一。那一年,墨西哥 H1N1 流感病毒的致死率出奇的高,而美国 H1N1 流感病毒的致死率却极低

致死率是相对简单的比率关系:由病死人数除以患病人数得出。但是,方程式中的两个数据都有较大的不确定性

H1N1 病毒一进入美国就成为媒体炒作的噱头,几乎没有什么病例可以逃过媒体记者的眼睛。有了如此高质量的报道,美国因 H1N1 病毒致死的数据想必是相当可靠的。

在许多涉及人类活动预测的案例中,预测行为本身就会改变人的行为方式。

若预测会自动实现,这种情况便可称为自我实现预测,或自我实现预言。

自我否定预测是指预测会自我破坏。

GPS 导航系统会依据车流量预测哪条路通行的时间更短,然后用语音提示你应该选的道路。可是,当很多车主都用同一款导航仪时,问题就出现了,大家都会选同一条路

关于中国的故事,这些故事你和我都读过,讲的是中国某些购物中心极尽装饰的情况——罗马圆柱、室内过山车,威尼斯运河,无一不有——但购物中心却没有店铺营业,也没有人逛。

预测是为了让损失最小化

正如另一位数学家所说:“一只猫最好的模型就是一只猫。”其他模型都会遗漏一些细节。

正如统计学家乔治·E·P·博克斯所写:“所有的模型都是错误的,但是其中有些是有用的。”

一些神经学家,如麻省理工学院的托马斯·波焦认为人脑处理信息的方式就是通过一系列近似值获得的。

成功的“赌客”以及任何领域中成功的预测者,从来不会以稳赚不赔的心态、无懈可击的理论和极其准确的尺度去看待未来,这些都是失败者的幻想,是过度自信的弊病。

他关注了几十名 NBA 球员的微博,仔细查看每一条 140 个字符的微博内容,试图从中找出关联信息:若某位球员发微博说自己那晚晚些时候会去某个夜总会,那这位球员的心思很可能根本就没在比赛上

尔加利斯十分关注球队教练在新闻发布会上说的话及他们的措辞,比如,如果某位教练说,他希望他的队伍“学习进攻”或者“练好篮球基本功”,那可能表明他希望放慢比赛的节奏。

埃尼迪斯告诉我:“过去 20 年里,可供使用的信息、基因组学和其他技术皆呈指数增长,有几百万个有趣的变量供我们测量。因此,我们希望利用这些信息和技术使预测成真,我这样讲并不是说我们过去没有取得多少进步,几百万份论文铺天盖地,如果真是没有什么进步,那将多么令人惭愧。但我们的新发现的数量明显比不上论文的数量,在创造新知识方面,大部分论文所做出的贡献真是微不足道。”

拥有的信息量呈指数增长,需要验证的假设也正在以同样的速度增长。

这也是为什么我们的预测在大数据时代更容易失败。拥有的信息量呈指数增长,需要验证的假设也正在以同样的速度增长。

大多数数据都只是噪声,就像宇宙的大部分都是真空区一样。

如今的真实信息也并不比互联网和印刷机问世之前多多少。

费希尔兴趣广泛,是当时最杰出的生物学家和遗传学家之一,但作为精英人物,他却毫不掩饰地抱怨社会贫困阶层的生育率高于知识分子阶层的生育率。

贝叶斯定理不过是一个简单的数学公式。可贝叶斯定理的应用却让他们十分担忧,对贝叶斯先验概率这一概念格外忧心,他们认为这一概念似乎过于主观。

一些民调公司总是显示出对某一党派的倾向:他们可能对 2 亿美国成年人进行调查,但仍然得不到正确的结果。

如果使用的工具本身就带有偏见,那么作了多少测量并不重要,因为你的目标定错了。

许多现在被广泛接受的科学发现,曾一度被视为一派胡言。

美国国家公园管理局提示游客,遇见灰熊时应尽可能地保持安静,必要时需躺下来装死。

就在 1988 年年底,丹麦的国际象棋大师本特·拉森被一个名为“深思”的计算机程序打败,这个程序是一项由研究生设计的项目成果,它是由卡内基梅隆大学的几个学生设计的。

IBM 网站曾评价“深蓝”计算机庞大的数据库:“卡斯帕罗夫不是在和计算机比赛,而是在和从前那些象棋大师的灵魂过招。

到中局时,则需要计算 40 的 6 次方,也就是有 41 亿种可能性。所有这些可能的局面,深蓝可以在 20 秒内计算出来,但是卡斯帕罗夫就算不吃不睡不洗澡,夜以继日地计算,也需要花上 43 年的时间才能算完。

像卡斯帕罗夫这样的伟大棋手从不会自欺欺人地认为自己能够计算出所有的可能性。这正是大师级棋手和业余棋手的差别所在。

阿德里安·德·格鲁特曾经针对国际象棋选手做过一项非常有名的研究,该研究发现,业余棋手下棋时总想找到完美的一招,寻求未果便会倍感沮丧,往往举棋不定,寸步难行。

首字母缩略词“GIGO”(意为无用输入,无用输出)

谷歌不可能对每个搜索问题都进行这样的操作,因为每天公司会收到上亿条搜索。但是,瓦里安告诉我,当出现有代表性的搜索问题时,他们仍会使用人工评测。然后他们会对比哪个统计测量的结果(尤其是从相关性和有效性上来看)和人工判断的结果相关。

PageRank 信号不过是谷歌 200 个信号中的一个,谷歌利用这些信号一步步向人工评估结果靠拢。

把对手的底牌缩小到一种可能性的情况并不常见,而电视节目却会让你相信你可以做到这一点。

在扑克牌游戏中,即便你能做出的决定的正确率为 95%,但仍会输个精光,因为你的对手做出的决定的正确率为 99%。

全球扑克牌玩家中拥有学士学位的人数比例是 52%,是全美拥有学士学位人数比例的两倍,是彩票购买者中拥有学士学位的人数比例的 4 倍。

2009 年全年,美国股票的交易总额超过 46 万亿美元,这个数字是世界 500 强企业年收入总和的 5 倍。

20 世纪 50 年代,美国一般的公司股票平均要持有 6 年后才能进行交易,

到了 21 世纪,同样一只股票的持股期不用 6 年,而是买入 6 个月后就可进行交易,股票的交易速度提高了 12 倍,且这一速度的增长态势完全没有减缓的迹象:股票市场的交易总额经过 4~5 年就会翻一番。随着高频率交易的出现,现在纽约证券交易所中的某些股票在一微秒内就可以完成交易,速度惊人。

大多数交易反映的是人们对某只股票未来收益的不同看法,这些看法就是差异巨大的预测。

本书的核心前提就是,若想做出更准确的预测,就必须承认我们的判断是不可靠的。

大多数对美国政治下注的人都来自欧洲或其他国家。

股市的运转在很大程度上是不可预测的。

基金在不同时期的表现几乎毫无关联。

基金在不同时期的表现几乎毫无关联。EVTMX 在 2002~2006 年被评为最佳表现基金,但在随后 5 年里却表现平平。

没有一只基金能一如既往地表现良好,甚至 5 年期限就是极限。

到 2010 年,科技公司的产值贡献只占所有经济活动总量的 7%。

在不同时期,标准普尔 500 指数中所有上市公司的市盈率变化幅度从 5(1921 年)到 44(2000 年希勒的书出版时)不等。

在一般情况下,确实只有达到 10 年或 20 年的期限,市盈率才能帮助投资者做出可靠的预测。

布洛杰特是这么评说 1998 年的互联网泡沫的,“股票投资者购买的其实是他们对未来的憧憬”。

布洛杰特力劝投资者购买股票时应该看重公司的实际价值,更应关注一个行业的“领头羊”,比如,互联网行业的领头羊亚马逊网站、雅虎网站、易趣网站等,而不必太关注那些小型公司

布洛杰特对我说:“与很多投资经理人交谈后我会发现,他们可能会考虑下周、下个月或是下个季度的情况。其实这份工作没有时间范围,关键在于和你的竞争对手相比,你自己当下的表现如何。确实,你只需要保证 90 天内不出问题即可,可一旦这 90 天内出现任何错误,客户就会辞退你,舆论媒体会挖苦你,从此以后你的表现会一塌糊涂。

经纪人只关心股票未来 90 天的表现。股市的市盈率高达 30,即股价估值已经是正常值的两倍,但在 90 天内股市崩盘的可能性只有大约 4%。

股票经纪人知道,在引火烧身前这样的赌局只能玩几次。但现实是,他还有别的选择吗?

如果这位股票经纪人的客户超有耐心,想要提前一整年预测股市的状况,他就会发现股市崩盘的概率会升至约 19%。这和俄罗斯轮盘赌赌输一局的概率是一样的。这位股票经纪人知道,在引火烧身前这样的赌局只能玩几次。但现实是,他还有别的选择吗?

股票经纪人将股票抛出,但是股价却涨了。这个情况对他来说不啻于一场灾难。这不仅使得同行们的操盘表现大大超过了他,而当初他竟还伸长脖子大呼同行们是傻子。

股票经纪人买入股票,但股市却崩盘了。这种情况真是不妙:他让公司损失了一大笔钱,自己也拿不到大笔佣金,不能买新款雷克萨斯汽车了。但他并不是“孤军奋战”,他的同事大多数都犯了同样的错误。

如果我是这位股票经纪人,当股市崩盘的概率为 20%的时候,我绝不会将股票抛出。甚至当这个概率达到 50%的时候,我也不会抛出股票。

大型证券公司都倾向于避免“鹤立鸡群”,不到万不得已,不会降低某只股票的买入评级。2001 年 10 月,17 名分析师中有 15 名依然将安然公司的股票买入评级定为“买入”或是“强力买入”,尽管那时安然公司的市值已经缩水了 50%,并曝出了财务丑闻。即使这些证券公司知道某家公司大势已去,但最有利于他们的选择仍旧是尽可能地维持这只“将死的骆驼”的生命。

20 世纪 60 年代法玛写论文的草稿时,机构投资者持有的股票只占市场的 15%,而到 2007 年,这一比例已经升至 68%。

在班内举行一场拍卖会,让学生竞拍一罐硬币。出价最高的学生将赢得那罐硬币(如果不想要零钱,他也可以得到等价的纸币),还要向老师支付一笔拍卖服务费。几乎每一次中标的学生都会发现,这笔交易不值那么多钱。

我们有理由怀疑投资者存在多种认知偏见,而过分自信就是其中危害最大的偏见。

行为经济学的核心成果就是发现大多数人在预测时都表现得过分自信。

泡沫事实上需要很长时间才能被挤出。

做空引发的损失在理论上是一个无底洞。

在实践中,借给你股票的投资者在认为你存在信用风险时,能够随时要回股票。这也意味着他能够在股价有利于他自己时选择退出交易,因为股市中存在这么个大问题,它使得被高估的股价在恢复到较为公平的价格水平前,会被更严重地高估。

当出借人了解到你可能必须动用存款来还清欠款时,他有权向你索取极高的利率,而你为了继续这笔交易,通常都会接受他的条件。

正如约翰·梅纳德·凯恩斯所说:“在市场回归理性前,你可能已经破产了。

事实证明,要卖空 Palm 股票相当困难,因为几乎没有一个 Palm 股票的持有人愿意出借股份,他们都期待能从中大赚一笔:每年能有 100%的投资回报率。这一模式在互联网泡沫时期非常普遍。

股市中存在着很多不对称的问题,比如股市泡沫很容易觉察但很难击破。

若你真的认为股市将要崩盘,那为什么不放手一搏——在现实世界中是行不通的,因为现实生活中交易有限,资金有限。 金融市场中的噪声 非理性交易者和娴熟交易者之间存在共生关系,正如在扑克牌游戏中,牌桌上需要一些新手,这样出色的玩家才有利可图。

有一位经济学家看见路上有一张 100 美元的钞票,正打算弯腰去捡,另一个经济学家对他说:“别费力了,如果那真是 100 美元,别人肯定早就捡起来了。”

事实上,有效市场假说存在着自我否定的含义。如果所有投资者都相信这个理论——市场是无法战胜的,他们就不可能从交易中获利,就没有人愿意进行交易,市场也就不存在了。

亨利·布洛杰特对我说:“人人都认为自己拥有这样一名才智过人的共同基金经理,曾求学于哈佛大学,拼杀股市 25 载。可为什么他还是无法战胜市场呢?因为股市中有 900 万名和他一样优秀的交易商,每人都有 5 000 万美元的预算,每人在纽约证券交易所都有一台计算机。在这种情况下,要如何打败由他们构成的市场?”

美国“盖洛普咨询公司”和其他一些民调机构会定期对美国民众进行调查,询问他们是否认为现在是投资股票的好时机。从历史数据来看,该民调结果和股票走势有着很密切的关系,但是负相关的关系。

美国民众认为,市盈率趋高且股价被高估时,恰恰是买入股票的好时机。

盖洛普的记录显示,2000 年 1 月时民调结果达到了最高值,有 67%的美国民众认为这时是投资股市的好时机。然而,仅仅两个月后,纳斯达克综合指数及其他股指就开始暴跌。

1990 年 2 月,只有 26%的美国民众认为此时投资股市是正确的,结果此后的 10 年,标准普尔 500 指数几乎增加了 3 倍。

市场通常都是基本正常的,只是偶尔出错。顺带提一下,这也是现实中的市场泡沫很难被击破的另一个原因。

在经济预测中,数据贫乏,理论研究薄弱,所以阿姆斯特朗才会认为“(经济)模型越复杂,预测越糟糕”。

任何预测模型的目标都是尽可能地“抓住信号、扫除噪声”。

自罗斯福“新政”实施到 20 世纪 70 年代以来,美国众议院两党之间的分歧已经有所减少,但在 2011 年,分歧又开始加大,在过去至少 100 年的时间里,两党之间的分歧达到了顶峰。

在政治领域,真相并不能享有特权,它可以是任何人的猜测。

虽然美国情报官员已成功破译日本密电码“紫色”(PURPLE),可解读日方 97%的外交密电,但是美国破解日本军事密电的尝试却鲜有成功。

从 1941 年 11 月中旬开始,日军无线电全部静默,致使美国对日军航母的行踪一无所知。

其实,日本航母舰队当时正在开往夏威夷的途中。

1941 年 12 月 8 日,美国国会以 470∶1 表决通过对日宣战,正式加入第二次世界大战。

我们把无知当成博闻,结果变得更加不堪一击。

美方推测,如果日本正在策划攻击,就得先攻占苏联(东北部地区),或英属亚洲殖民地,而苏联和英国早已卷入第二次世界大战,日本已经树敌众多,为什么还要激怒美国这只沉睡的雄狮呢?

人们常常误以为“不熟悉”就是“不可能”。

人们在作规划时,总会将不熟悉和不可能相混淆。

有些事是已知的已知,即我们清楚自己知道它。有些事是已知的未知,即我们清楚自己不知道它。有些事是未知的未知,即我们并不清楚自己不知道它。 唐纳德·拉姆斯菲尔德

几乎没有什么事情能简单地划分为可预测和不可预测这样的二元类别。

只有 93 号航班没有被恐怖分子利用,这完全是因为乘坐该飞机的乘客在得知飞机被劫持后英勇搏斗,成功护卫住飞机驾驶舱,最终飞机在宾夕法尼亚州的尚克斯维尔附近坠毁。

北美航空航天防御司令部曾经提议进行一次有关“被劫客机袭击五角大楼”的军事演习。但是,这一想法因为“太不现实”,最终未被考虑。

我们常常会高估那些在时空上离我们更近的事件的发生概率,而那些离我们较远的事件,我们常会低估其发生的概率

“如果人们不愿去死,那你就可以按照常理对其行为进行预测,”拉姆斯菲尔德对我说,“但是,如果人们视死如归,或者觉得死亡是一种殊荣,觉得死得其所,那他们就不会按常理出牌了。”

拉姆斯菲尔德在他的回忆录中提到:“9·11”恐怖袭击事件是一个未知的未知。

弗拉基米尔·列宁曾经说过:“恐怖主义的目的是为了使人恐惧。”

恐怖分子是想使某个群体的恐惧情绪最大化,从而让该群体转变行为方式。死亡和破坏都是达到这一目标的手段。拉姆斯菲尔德也曾对我说过:“恐怖分子可能会通过杀人达到目的,但杀人并不是最终目的。”

奥萨马·本·拉登曾说过,他想要谋杀 400 万名美国人,并且只有借助核武器才能实现这一目标。

俄罗斯的威胁已经减弱,但是巴基斯坦的威胁却增强了,甚至是急剧增强。“如果你绘制一幅有关大规模杀伤性武器和恐怖主义的分布地图,那所有路径都会贯穿巴基斯坦。”

核物理学家数量本来就不多,那些能被恐怖组织信任的科学家更是少之又少。“

有一个常被援引的估值:“基地”组织人数最多时也只有 500~1 000 人,其中包括一些随从和狂热追随者,还包括参与组织各项非暴力功能运转的成员,例如在“基地”组织中,一些胆小的家伙就得负责在该组织的网络瘫痪时对其进行重新修复。来自卡内基梅隆大学的凯思林·卡莉以叛乱组织的社交网络为研究对象。她告诉我,极端分子里只有 1%的人真的很极端。确实,去做本·拉登的信息技术顾问促进“全球圣战运动”,要比当人体炸弹冲入人群炸毁自己容易得多。 然而,在提出这类问题时,我们还是得十分认真,因为我们可能又会将不熟悉的事误认为是不可能发生的事。“恐怖分子为什么不去炸毁购物中心”这个疑问在以色列人看来荒谬无比,因为那里经常发生购物中心被袭事件。

之所以没有发生那么多恐怖袭击,其中一个原因也许是没有那么多恐怖分子。

来自卡内基梅隆大学的凯思林·卡莉以叛乱组织的社交网络为研究对象。她告诉我,极端分子里只有 1%的人真的很极端

2012 年一份对以色列犹太人的调查表明,只有 16%的人认为恐怖主义是最可怕的事,而更多的人称他们对以色列的教育体系最为担忧。

小规模的恐怖袭击在以色列被视为普通犯罪,不算恐怖威胁。

以色列国家安全战略中的关键元素,就是如何在袭击之后恢复人们的生活秩序。

美国发动伊拉克战争的既定目标之一,是阻止伊拉克继续发展大规模杀伤性武器。当然,那里实际上并没有大规模杀伤性武器。

当我们过于想要发动一场战争时,不可靠的信号来源也会被解读成可靠的,例如伊拉克战争发生前,伊拉克工程师拉菲德·阿尔贾纳比——代号“曲线球”——为了推翻伊拉克独裁者萨达姆·侯赛因,谎称自己过去服务的种子工厂是一座制造生化武器的秘密工厂。

正如“9·11”恐怖袭击事件委员会推测的那样,我们之所以无法成功预测恐怖袭击,最大的原因在于我们缺乏想象力。

1990 年发明万维网的蒂姆·伯纳斯·李对我说:“正因为有了互联网,整个环境、所有方程式、所有信息的动态传播都发生了变化。”

大量的信息成倍增加,但有用的信息却非常有限,信号的比例正在缩小。

大脑在处理信息时使用的是近似法。与其说这是一种既成事实,不如说它是一种生物必要性:我们察觉到的信息远多于我们有意识进行思考的信息,我们处理信息的方式是按照规律和模式对它们进行分类。

贝叶斯定理告诉我们,任何时候获得新信息,我们都应该更新自己的预测。简单地说就是,不断犯错,不断尝试。

不断犯错,不断尝试,这或许是贝叶斯定理应用起来最容易的一个原则了:进行大量的预测。

Written on April 24, 2023