登陆注册
3057800000038

第38章 贝叶斯定理:只有正确的预测才能让我们更接近真相(8)

很多领域的情况介于这两种极端情况之间。数据通常还不错,但是仍不够好,对产生这些数据的系统和过程,我们都有所了解,但了解得还不够充分。在此类案例中,要想改进预测,也许能够借用“深蓝”的程序员们处理数据的方法:试错法。这也是许多公司经营战略的核心所在,这些公司和当今这个大数据时代可谓休戚相关。

用试错法提高计算机的预测能力

2009年年末,我到加利福尼亚州芒廷维尤的谷歌总部进行采访,在那里,你很难分清谷歌的员工什么时候是在严肃工作,什么时候是在嬉笑玩闹。谷歌公司以“红、黄、蓝”三原色为装饰主色调,配备排球场,还有可想象到的各种造型的两轮摩托车,这样的公司文化能激发员工的创造力。每一个谷歌人,甚至包括工程师或经济学家,都可以不落俗套、异想天开。

“这类实验这里随时都有,”谷歌首席经济学家哈尔·瓦里安在和我会面时这么说道,“你更应该把这里看作一个有机体,一个有生命的组织。我曾经说过,某个物体被赋予生命后就应该得到我们的关注,就像《终结者》中的天网一样。但是,我们已经和加利福尼亚州政府达成协议。”那时,阿诺·施瓦辛格正担任州长。“他们会来帮助我们。”

谷歌对其研究项目和其他产品进行了广泛测试。瓦里安说:“2008年,我们对研究项目进行了6 000次实验,广告货币化的实验大约也有6 000次。所以,谷歌一年大约要进行10 000次实验。”

其中有些实验是有形的——偶尔还能延伸出一条新的产品链。但大多数实验都较难被觉察:将公司的标志移动几个像素的位置,或是对广告牌上背景颜色的序列稍作改变,然后观察调整后的点击量的变化或是货币化的效果。其中许多实验会应用到约0.5%的谷歌用户中,是否应用取决于这个构想的发展前景。

当你利用谷歌搜索词条时,你可能没有意识到自己已经参与到谷歌的实验中。但从谷歌的角度看,事情则稍有不同。谷歌返回给你的搜索结果和首页中显示的排序,代表了谷歌对你认为最有用的搜索结果所作的预测。

对有用性的衡量和预测貌似非常主观,那谷歌又是如何做到的呢?如果你搜索“最好的新墨西哥餐厅”这一词条,这是否说明你正计划到阿尔伯克基旅行呢?还是说明你在寻找最近刚开业的墨西哥餐馆?又或许你想要知道哪家墨西哥餐馆有怒希沃拉丁菜?也许你应该组织好搜索的问题,可你并没有这样做。于是谷歌会召集1 000个陪选团,他们都提出了相同的问题,谷歌会呈现给他们丰富多变的网页,让他们从零到10为每一个网页的有用性评级。然后,谷歌展示给你的网页就是按级别高地排列的结果。

当然,谷歌不可能对每个搜索问题都进行这样的操作,因为每天公司会收到上亿条搜索。但是,瓦里安告诉我,当出现有代表性的搜索问题时,他们仍会使用人工评测。然后他们会对比哪个统计测量的结果(尤其是从相关性和有效性上来看)和人工判断的结果相关。谷歌针对网站的统计测量最著名的就是PageRank信号了,这个测量案例根据网站的外部链接和内部链接的数量来衡量网站的价值。但是,PageRank信号不过是谷歌200个信号中的一个,谷歌利用这些信号一步步向人工评估结果靠拢。

当然,这个任务并不轻松——要将200个信号应用到几乎存在无限可能的搜索问题中。这就解释了为什么谷歌如此强调实验和测试。你所知道的谷歌搜索这一产品质量已经很高了,但明天公司可能又会对其进行调整。

谷歌公司之所以成功,是因为它将严密谨慎的测试和随心发挥的创新文化有机地结合起来。公司鼓励员工超越电脑,去做电脑做不了的事情:要想点子,各种各样的好点子。随后,谷歌会使用大量的数据测试这些点子。其中大多数点子很快会遭到淘汰,但最棒的点子会保留下来。

计算机程序就是用这种筛选的方式下象棋,它能够探寻几乎所有可能的选择,并进行一定程度的研究,但它更加关注那些更有攻击潜力的招数。这一点十分符合贝叶斯定理:谷歌永远都处于运行的开端,不断修正其搜索运算程序,永远不会因为觉得这些程序已经完成而停止。

谷歌基本上能够立刻获得全球百万名用户的反馈,但多数时候,我们无法像谷歌这样迅速获得反馈来检测一个构想。“深蓝”的工程师们可以方便使用超级计算机,但是我们却没有这个条件,所以进步速度就要慢得多。

然而,我们要关注自己的预测在现实生活中的表现,而不是只满足于它在数据模型中的表现,简言之,就是立下自我检查的承诺,这也许是加快我们学习预测过程的最佳途径。

克服人类的技术盲点

在许多方面,我们自身已成为最大的技术障碍。人类缓慢稳固的进化进程已经远远落后于科技进步的步伐:人类进化以千年来算,然而技术的处理能力每隔一年几乎就翻一番。

我们那些生活在山洞中的祖先可能已经发现了一个问题,即拥有强大甚至过盛的模式识别技能是极为有利的,这样就能够在一瞬间识别出远处树叶的瑟瑟声是风引起的还是一头入侵的灰熊制造的。如今,在这样一个快节奏的社会里,各种数字和统计数据泛滥成灾,原本的习惯和倾向反而让我们陷入麻烦:当我们看到一系列的随机数字时,竟能看出其中根本就不存在的模式。(广告人和政客们常常利用这种现代骗术来欺骗我们。)

国际象棋则能引导我们走向美好结局。卡斯帕罗夫和“深蓝”的程序员将彼此视为敌手,但是他们都教会我们一点——预测时,计算机的处理速度和人类思维的精巧应该相互补充。

事实上,目前世界上最精彩的象棋比赛既不是由某位人类棋手完成的,也不是某台机器完成的。2005年,ChessBase.com网站举办了一场“自由式”国际象棋锦标赛:选手可以随意地使用自己喜欢的计算机程序补充自己的见解,并通过互联网征求建议。尽管一些大师也参与了比赛,但是比赛的赢家既不是最厉害的人类棋手,也不是那些使用最先进电脑软件的选手,而是由来自新罕布什尔州的两名二十几岁的象棋业余爱好者——史蒂文·克兰普顿和扎克里·“柴克斯”·史蒂芬——共同获得,他们将3套计算机程序结合起来算出结果,共同决定棋路。克兰普顿和史蒂芬之所以获胜,是因为他们既不敬畏技术,也没有被它吓倒。他们了解每个程序的优缺点,他们更像一个教练,而不是选手。

然而,看到 “电脑认为洋基队将赢得世界大赛”这样的句子时,你应该保持警惕。但如果它是以下这句话的速记版本——“计算机程序输出的结果是洋基队将赢得世界大赛”——那它可能不会带来什么恶性后果。当今世界信息横流,能够拥有那些计算速度远超过我们的机器,肯定是大有裨益的。

但是,如果你感觉预测者更倾向于这种看法——认为计算机是一个有知觉的个体,或是一个有自己思想的模型——这也许就表明这位预测者根本就没有进行什么思考。无论预测人员带有什么偏见和盲点,这些偏见和盲点肯定会被复制到他的计算机程序中。

我们必须以客观的态度看待科技——它就是一个能改善人类生存环境的工具。我们既不应该对技术的祭坛顶礼膜拜,也不该被它吓唬住。至今还没有人设计出一台能与人类相媲美的计算机,或许永远也没有人能做到这一点。但计算机本身就是人类进步和智慧的反应:如果某个技巧是由人设计的,那它就算不得真正的“人工”智能。

同类推荐
  • 商人活用孙子兵法

    商人活用孙子兵法

    本书将古代智慧与现代商业经营紧密结合,以全新的解读方式,通过精辟的活用解析与经典的经营案例,多层次、多角度阐述了现代商战的策略与技巧,堪称商界有识之士赢得商战竞争的智慧之源。
  • 中国农产品对外贸易保护政策研究

    中国农产品对外贸易保护政策研究

    本书内容包括:经济全球化中的国际农产品贸易、发达国家农产品对外贸易保护政策及其实施、多边体系下国际农产品贸易保护政策的发展趋势、中国实施农产品对外贸易保护政策的现实基础等。
  • 中国农业自然灾害的风险管理与防范体系研究

    中国农业自然灾害的风险管理与防范体系研究

    《中国农业自然灾害的风险管理与防范体系研究》紧紧围绕农业自然灾害以及自然灾害的风险管理与防范体系展开研究。《中国农业自然灾害的风险管理与防范体系研究》首先分析了我国农业自然灾害的基本状况、基本特征、基本类型和农业自然灾害产生的原因;紧接着研究了自然灾害对经济发展的影响、对农业经济波动的影响和对农村贫困的影响;进而阐述了我国农业基础设施建设与减灾抗灾能力的基本状况;最后提出了构建具有中国特色的农业自然灾害风险管理与防范体系的具体措施。全书环环相扣,自成体系。
  • 经济学常识1000问

    经济学常识1000问

    作为如今社会上使用频率最高的词汇之一,“经济”当之无愧——几乎无人不知无人不晓,经济学更是大行其道,成为最热门的研究领域,科学不是具体的事物,而是抽象的学问。一门科学,必有一套自己的概念和体系,有自己独特的方法。古代大臣们对经济问题的真知灼见,也许有不世之功,但不系统、不规范,都不是经济学。经济学这门学问,是对人类各种经济活动和各种经济关系进行理论的、应用的、历史的以及有关方法的研究的各类学科的总称,是20世纪的显学,其根本作用是富国裕民。照理说,这样的学问一定历史悠久,可是,正相反,经济学是一门相对年轻的科学。
  • 中国经济热点问题探索

    中国经济热点问题探索

    本书分“关于劳动和劳动价值论”、“关于收入分配”、“关于农业和农村经济发展问题”、“综合经济问题”四个部分,收入《全国高校社会主义经济理论与实践研讨会第十五次会议》上的论文近百篇。
热门推荐
  • 生活礼仪一百问

    生活礼仪一百问

    本书讲述了日常生活中的各种礼仪和行为规范,从传统、餐饮、婚姻、节日、职场、涉外、鲜花礼仪等方面,解决读者中普遍涉及的礼仪问题。
  • 冥界悬疑录

    冥界悬疑录

    突然苏醒的恐怖操场,源头究竟是什么?如果你请来的笔仙继续请笔仙会发生什么后果?不断被杀害并被啃食的老师和狱警,他们招惹了谁?随着时间的推移冥界的封印逐渐减弱,命中注定的结果能否被打破……
  • 月屋漫稿

    月屋漫稿

    本书为公版书,为不受著作权法限制的作家、艺术家及其它人士发布的作品,供广大读者阅读交流。汇聚授权电子版权。
  • 女尊天下:绝色江山美男

    女尊天下:绝色江山美男

    意外穿越,她身边环绕着无数美男。可谁说女尊就轻松了,她深陷谜团,周旋于江湖朝堂,还一不小心惹下一身桃花债。她原只想偷得度日,如今只好迎风而上,翱翔九天,看尽这绯色江山。
  • 多米诺骨牌疑云

    多米诺骨牌疑云

    一个普通的星期五下午,乔莱格在院子里看着《每日一报》,上面刊登的活动告示有很多,但他最终选择参加了绿湖多米诺骨牌俱乐部的新成员招募活动。一块多米诺骨牌接着一块多米诺骨牌,它们搭起来的不仅是一条试炼长龙,更是一条一推即倒的死亡之线……星期日的绿湖多米诺骨牌俱乐部,人总共来了十个。星期日的绿湖多米诺骨牌俱乐部,人最终回了三个。星期日的绿湖多米诺骨牌俱乐部,凶手究竟是谁?
  • 星羽传奇

    星羽传奇

    两兄弟自幼无父无母,在山村中生活,为了寻找父母走出大山,走进俗世,各种艰难险阻,各种恩怨纠葛,各种爱恨情仇...是化身成魔,还是不忘本心走到最后...
  • 鸿蒙七珠

    鸿蒙七珠

    一颗珠子划过地球上空,带走了风云无忌的灵魂,从而开启了他新的人生……
  • 骑蜗牛的旅行

    骑蜗牛的旅行

    “2011年最值得推荐的儿童文学作品”精选自2011年报刊上的优秀作品,这些作品故事精彩,题材多样,符合少儿喜爱故事的天性。不仅有少儿领域具有导向性作家的作品,比如常新港、老臣、曾小春、谭旭东、范锡林、黄春华、彭学军、佘雷、章红、汤素兰、龚房芳、凌仕江等,还有一大批新锐少儿作家,比如曾维惠、两色风景、毛小懋、喻虹、汤汤、麦子、徐玲、贾颖、谢倩霓、李宏声、王宜振、慈琪、何腾江、周锐、杨士兰、贾月珍、吉葡乐、陈亦权等人的作品。可谓2011年度少儿文学领域的权威选本。
  • 321为爱向前冲

    321为爱向前冲

    “哇-哇,脸皮真厚啊……如果递递情节就能打动王子信,我估计三年级的教室都要被情书淹没了……”又一个女生尖声嚷嚷道。“啊呀呀,她暴走了’众人一阵惊呼。什么情书?什么王子?不如凑过去瞧瞧吧!我按捺不住心中的好奇,正想转过身去看个究竟……”全宇宙超级无敌的冷酷自大男景祈信,全星球嗜财如命的古灵精怪女袁菲儿全场了,本书将展现给读者一个浪漫幽默的校园爱情故事。
  • 大宋巨贾

    大宋巨贾

    在北宋建立一个超时代的商业帝国!不做官,也能指点江山!这就是杨立穿越后令宋真宗又忌又爱的人生!本书讨论群:108476903