登陆注册
3057800000022

第22章 地震预测:一个困惑了人类1 000年的难题(3)

起初,鲍曼和他的团队确实取得了一些成功:2005年3月,一场震级为8.6级的大余震袭击苏门答腊岛,震中就在鲍曼测出的高风险区域。然而,2006年鲍曼发表的一篇论文表明,在这一个断层中的另一个区域发生地震的可能性较低,这片区域位于印度洋,邻近印度尼西亚的明古鲁省。然而就在一年后的2007年9月,一系列地震就发生在这片区域,最高震级达到8.5级。幸运的是,这些地震离近海很远,伤亡较少,但却推翻了鲍曼的理论。

2007年“加速力矩释放”模型失败,鲍曼并没有像其他预测者那样责怪运气不好(其实,他的模型也考虑过明古鲁市附近可能会发生地震,只是认为可能性不大),而是重新检查了自己的模型,认定用这种方法预测地震是完全错误的,于是决定弃用。

“我是一个失败的预测者,”2010年鲍曼告诉我说:“我做了一件大胆却愚蠢的事。我进行了一个可试验的预测,我们应该这么做,可一旦出错,就要自食其果。”

鲍曼一直有一个想法,通过识别地震的成因——地质断层上累积的压力——对地震做出预测。实际上,鲍曼想要了解的是,在整个断层体系中,压力是如何变化和蔓延的。他的这一观点是受混沌理论的启发得来的。

混沌理论是一个可以制服的恶魔,气象预报员就成功地做到了这一点,至少在一定程度上做到了这一点。气象预报员对大气的理论认识要比地震学家对地壳的了解深刻得多,他们或多或少地知道天气是如何变化的,这种认识甚至深入到分子层面,但地震学家却没有这样的优势。

鲍曼评论道:“对气象系统的研究来说,想要了解大气变化是一件很简单的事,只要抬头看看天就好。而我们观察的是岩石,大多数研究对象都在地下15 000米的地方,我们不能期望钻个洞探下去,说实话,那只是科幻电影中才有的情节。这是一个根本性的问题,我们没有办法直接测量地壳的压力。”

因为缺乏这样的理论认识,地震学家只能采取纯统计方法预测地震。你可以像鲍曼一样,在自己的模型中创设一个名为“压力”的数据变量。由于无法直接对其进行测量,“压力”这一变量只能表达为过去发生的地震的一个数学函数。而鲍曼认为这样的纯统计方法根本不可能奏效,“数据集里满是噪声干扰,光有统计学意义的数据并不足以验证假说”。

在地震预测和部分的经济学、政治学领域中,有很多干扰数据,理论也不发达。这些领域的知识预测常会按照两步法进行:第一步,将干扰噪声误认为有用信号;第二步,噪声信息流毒于学术期刊、博客媒体、新闻报道,并发出错误的警示,破坏科学,阻碍我们理解这些系统的真实情况。

过度拟合模型:将噪声误认为信号

在统计学中,将噪声误认为信号的行为被称为过度拟合。

假设你是一个小偷小摸的惯犯,而我是你的老板,我要求你想出一个撬密码锁的办法,就是中学学校里常见的那种锁——也许我们打算去偷学生的午饭钱。我期待的撬锁法是,能让我们无论何时何地都可以很有把握地撬开锁。我给了你3把锁进行练习,红色的、黑色的和蓝色的。

用这几把锁反复试验了几天后,你回来告诉我,你发现了一个绝对正确的办法:如果锁是红色的,密码组合就是27–12–31;如果锁是黑色的,密码组合就是44–14–19;如果锁是蓝色的,密码组合就是10–3–32。

但我告诉你,你根本就没有完成任务。的确,你想出了开这3把锁的办法,但你并没有作更多的努力提升撬锁理论,这个理论可以指导我们撬开随意一把陌生的锁。我一直非常想知道有没有一种办法可以撬开所有的锁,或者锁本身有什么结构缺陷可被我们利用,或是有哪些破解密码的技巧,比如,某一类数字更常被用作密码,等等。但是,你却给了我一个过于具体的办法,妄图解决一般问题。这就是过度拟合,它是导致预测错误的原因。

拟合的说法源自统计模型和过去的观测结果相吻合的程度,当过于粗略地拟合时(我们称之为不充分拟合),这时我们会错过本可以捕捉到的信号。当拟合太过紧密时(我们称之为过度拟合),这意味着你在对数据中的噪声进行拟合,而不是挖掘数据的深层结构。在实践中,过度拟合的错误更为常见。

为了弄清楚这种错误的成因,我们暂且赋予自己一种在现实生活中几乎不可能拥有的优势——我们清楚地知道真实数据原本的面目。在图5–4中,我画了一条平缓的抛物线,顶点落在中间位置,末端逐渐减弱。这条抛物线用来代表你希望了解的所有现实数据。

然而,我们还是不能直接观察到数据的深层关系,这种关系由一系列独立的数据点体现出来,我们只能从这些点推断出这种关系模型。另外,这些数据点还会受特殊环境的影响(有信号,也有噪声)。在图5–4中,我画了100个数据点,分别用圆形和三角形标记,貌似这样就足以从噪声中捕捉到信号。尽管这些数据中存在一定的随机性,但显然它们仍遵循着这条抛物线。

然而,当我们的数据相对有限时(现实情况常常如此),情况将会怎样呢?那时,我们就更有可能陷入过度拟合的麻烦中。在图5–5A中,我将100个数据点缩减至25个,这时,你会如何连接这些点呢?

当然,如果你知道真实数据应该呈现的关系模型,就会很自然地将它们连接成一条抛物线。确实,用二次方程式这样的数学表达式可以很好地重建真实的关系模型(如图5–5B)。

然而,在无法获知数据的理想模型时,我们有时就会变得很贪婪,图5–5C代表的就是这样一个例子,一个过度拟合的模型。在图中,我们设计了一个复杂的函数,可以追踪每一个边缘数据点,用这个函数将这些点连接起来,曲线的上下波动陡然增强。这使得我们离真实的关系模型越来越远,也会使预测更离谱。

这个错误貌似很容易避免,如果我们无所不知,对数据的深层结构总是了如指掌的话,这个错误也确实可以轻松避免。然而,几乎在所有的现实工作中,我们都必须利用归纳法,从已知的证据中对其结构进行推断。当数据有限又充满噪声时,当我们对基本关系的理解很浅显时,就更有可能对一种模型做出过度拟合,在地震预测中,这两种情况可谓司空见惯。

如果我们既不知道也不在乎数据关系的真相,就有很多理由可以解释我们为什么倾向于过度拟合的模型。其中一条就是,在预测者最常用的统计测试中,过度拟合模型更受青睐。有一项常用的测试是用来测量我们的模型可以解释多少数据的变化。根据这一测试,过度拟合的模型(图5–5C)解释了85%的数据变化,而适度拟合模型只解释了56%的数据变化。但是实质上,过度拟合模型是在混淆视听,将噪声误当作信号混入模型中。事实上,在解释真实世界时,它的表现更糟。

这种解释似乎让情况一目了然,但很多预测者完全无视这个问题。研究者拥有很多统计方法,可这么多的方法却没有让他们增加一点科学态度,减少一点幻想,而是像充满幻想的孩子在天空中寻找动物形状的云一样。数学家约翰·冯·诺伊曼谈到这个问题时曾说:“我用4个参数就能拟合出一头大象,用5个参数就可以让这头大象甩动它的鼻子。”

过度拟合代表了双重霉运:过度拟合的模型表面上来看比较好,但其实际性能却很糟糕。因为后一种因素,若被用在真实的预测活动中,过度拟合模型最终会让预测者付出沉重的代价。而因为前一种因素——其表面效果不错,而且自称可以做出非常准确并且新闻价值很高的预测,比其他应用技术都先进,所以,这类模型更吸引人,更容易在学术期刊上得到推介,也更容易被推销给客户,从而将其他可靠的模型排挤出市场。但是,如果这个模型是用噪声拟合的,就很有可能会阻碍科学发展。

你也许猜到了,克里斯–布鲁克的地震模型就是很严重的过度拟合模型。这一模型将一组超级复杂的方程式应用在噪声数据中,也因此付出了代价——预测正确率只有3/23。戴维·鲍曼意识到他的模型也有类似的问题,便果断终止使用。

应该说明的是,这些错误通常都是真实的。借用另外一本书的题目《随机漫步的傻瓜》来说就是,这些错误常影响我们,让我们更容易被“随机性愚弄”。我们也可能会越来越迷恋这种模型的特质,甚至可能会创造出一个貌似很有说服力的理论来证明这些错误的合理性,自己却没有意识到这一点,这不仅是愚弄同事、朋友,也是在愚弄自己。迈克尔·贝雅克曾就此写了大量的文章,他对这种进退维谷的情况作了如下解释:“在科学中,我们用怀疑主义平衡好奇心。”过度拟合的例子说明是好奇心左右了我们。

2011年日本大地震引发的思考

将噪声误认为信号的倾向,有时会给现实世界带来极可怕的后果。在日本,尽管地震活动极其频繁,但2011年那次灾难性的地震还是让这个国家措手不及。福岛核反应堆是按照可抵御8.6级地震的标准设计的,无法承受震级高达9.1级的地震。考古资料表明,2011年由地震引发的约40米高的海浪在历史上曾经引发过多次海啸,但这次人们明显忘记了或者根本无视这些惨痛的案例。

9.1级地震在全世界都很少见,没人能确切地预测到这样的地震会发生在哪个10年里,更不用说具体的日期了。而在日本,一些科学家和中央计划员却排除了近期发生地震的可能性。这一点就反映了日本的地震预测模型是过度拟合模型。

同类推荐
  • 经济学教程

    经济学教程

    本书主要对经济学的基本内容、基本原理及学习经济学的意义等方面作了简明的介绍。本书的特点是:1以“必须、够用”为原则,定位为初级经济学水平;2简明、通俗,以简明的语言和扼要的篇幅阐述艰深的经济学理论;3比较全面地反映了经济学近年来的发展趋势;4每章均以“参考资料”和“案例分析”帮助读者理解经济学原理,使抽象的经济学理论变得生动有趣。
  • 三农中国的经济学阐释

    三农中国的经济学阐释

    作者以经济学为视角,对当前中国社会发展过程中出现的一些社会问题、经济问题、“三农”问题进行了阐释,观点新颖,具有较强的可读性。书稿由三部分组成:一是社会问题的经济学分析;二是经济理论研究;三是乡村发展。
  • 人人都要懂点经济学:这个时代不懂点经济学要吃亏

    人人都要懂点经济学:这个时代不懂点经济学要吃亏

    本书在写作过程中,尽力还原经济学的本来面貌,剔除了经济学中那些枯燥、抽象的数学函数和定理法则,通过生动、有趣的故事来揭示其中的经济学原理,让您在轻松的阅读中,真正掌握这门会使您的人生更加幸福的学问。全书共分12篇,以经济学的理论体系为骨架,以古今中外的经济学现象为血肉,几乎涵盖了经济学的各个专业和领域,囊括了国内最新、最经典的经济学概念,生动而又严谨地阐述了社会生活中的各类经济学热门话题,可以说是一部经济学知识的百科全书。
  • 躲过骗子(经济篇)

    躲过骗子(经济篇)

    每每夜幕降临,繁华的都市里,各大舞厅、酒吧、酒店是门庭若市,热闹非凡。几乎每天都能见到这样一些大款们的身影,身着名牌服装、花钱阔气,一掷千金。他们不是成功的企业家,不是精明的商人,也不是继承海外巨额财产的“小开”。他们没有什么正经的职业,他们从事的“行业”,用民间语言表述叫做:做“跳楼”生意。用书面语言表述就是利用假合同和其他手段骗买骗卖。这里仅浮光掠影地举几个例子,看看他们是如何扰乱市场秩序,给正常的经济活动带来破坏的。
  • 看懂中国经济的第一本书

    看懂中国经济的第一本书

    国外人说:看不懂中国经济,根据最基本的经济学常识和各个国家的经济发展规律,中国的GDP(国内生产总值)增长速度早就应该降下来了。但让人奇怪的是,欧美等国家还没有完全从金融危机中复苏,中国2010年的GDP增速居然就超过10%了。国内人也说:看不懂中国经济,为什么居民收入增长跑不过GDP增速,也跑不过CPI(消费者物价指数)呢?为什么人民币国内的购买力下降了,国际购买力却上升了呢?
热门推荐
  • 现实很骨感:出来混读战国

    现实很骨感:出来混读战国

    假如你意气风发踏上仕途,正准备在公务员岗位上大显身手大战三百回合,那就读战国看吴起。吴老前辈将会告诉你要悠着点,有才的人其实从来都不少,单靠有才并不能保证你一定出人头地——也不意味着今生必然会比别人混得更滋润!有靠山可保你直线上升,而大树倾倒,你也可能危在旦夕!
  • 顾少的傲娇Goddess妻

    顾少的傲娇Goddess妻

    “顾希宸,你.个笨蛋!”苏冶颜气得内伤地指着正悠闲地躺在沙发上的顾希宸。天知道,这个魅惑的男人干了些什么。“老婆,贬低自己老公不是个好女人的行为哦。”顾希宸优雅地揭开正被他当成眼罩的..胸罩。冶颜打落牙齿和血吞。真的,她不认识这个二货!....他人美心美造型美,勤劳爱国还贤惠,偏偏看上了娱乐圈的一朵俏白莲。唉,有一个太爷们的媳妇不太好啊!颜颜哼哼,老公啊,今晚你去客房睡吧。顾希宸闻言,无辜的环顾四周,“该死的,哪个不要脸的,敢说我媳妇,我揍他去!”顾少,你这样真的好吗?甜蜜爆笑娱乐圈宠文、漫漫追妻路。无节操人生-顾少的傲娇女神妻!欢迎跳坑~
  • 梅道士水亭

    梅道士水亭

    本书为公版书,为不受著作权法限制的作家、艺术家及其它人士发布的作品,供广大读者阅读交流。
  • 极品蛇尊

    极品蛇尊

    她,黑云堂的帮主,倾城国色,却又好色专横,终于有了报应。他,蛇族之王,苦心孤诣,一心想成为万妖之王,不过最后功亏一篑,险些命丧九泉,沦为妖界的头号通缉犯。情节虚构,切勿模仿
  • 三界聊天群

    三界聊天群

    自从有了三界聊天群,嫦娥仙子跑来嘘寒问暖,太白金星给自己送礼物,那些神话里的人物,都成了自己的朋友,生活浪的不行!什么纨绔子弟,什么富二代,什么美女如云,统统都拜倒在自己脚下。
  • 东方夏洛克

    东方夏洛克

    中国留学生苏叡,留法期间为巴黎警察局屡破奇案,因侦破“童子军的恶魔导师”一案,破格获得法国荣誉军团司令官勋章,被称为“远东之鹰”,“东方夏洛克”。如今,苏叡学成毕业,带着仆人小乙回到帝国、黑帮、财阀、党派等势力林立、鱼龙混杂的上海滩,开辟传奇的新篇章。侦探推理小说,没有鬼神,只有人性。
  • 初一四班那些事儿

    初一四班那些事儿

    山子结束小学生涯,升上了初中一年级,住进学校宿舍,开始了集体生活。山子刚进学校便因歌声美、作文好一炮而红,受从人瞩目。可是,初一上学期的生活并不平静:丢了书、赔了钱,因为一把飞刀引发同学的误会、刁难,在上学路上遇到大黄狼……经历了这些事情之后,在父母、老师、朋友、乡亲的关怀下,山子渐渐变得坚强,渐渐成长为一个有理想的小男子汉。
  • 新编人力资源管理

    新编人力资源管理

    《新编人力资源管理》是针对普通高等院校管理类专业学生和广大从事人力资源管理工作专业人员而编写的。全书共分为十章,内容包括人力资源管理概论、人力资源战略规划、职位分析与职位设计、招聘与甄选、人力资源开发与培训、职业生涯管理与能力素质模型建立、绩效考核、 薪酬管理、劳动人事法规政策、人力资源外包等。
  • 水晶花开风灵之梦

    水晶花开风灵之梦

    精灵界的一场动荡使皇室覆灭,唯一幸存者逃亡地球,十年后,女皇回归风起云涌。
  • 以魂铸骨:绝色宠后太嚣张

    以魂铸骨:绝色宠后太嚣张

    她是二十一世纪的杀手鬼囚,千年难遇的锁魂师。一朝惨死,天惜英才,穿越到了千年之前那片神秘的大陆,却惨遭再一次猎杀。遗落的古战场,傀儡皇帝,消失的异能,一模一样的自己,一切都莫名指向初来乍到的她,从洛水中爬出来的神兽究竟有什么秘密。她哀嚎:“什么?傀儡皇帝?那么弱鸡!”而他:“凤羲,神族妒你,魔族畏你,妖族恨你,世人敬你,而只有我,才会保护你……”