登陆注册
9078900000028

第28章 评鉴中心的准确性(1)

关键内容:评鉴中心的效度;为什么说评鉴中心有效;成本收益分析。

前面几章详细介绍了评鉴中心方法的几个关键要素。我们已经讨论了如何选择测评指标以及怎样设计测评项目以产生与测评指标相关的行为;总结了单个测评师如何观察和评价行为,测评师团队如何形成一致、准确的评判;我们还谈到了高层管理人员如何在测评信息的帮助下做出组织决策,测评对象及其上级如何利用这些信息提高他的管理和专业技能。

现在,让我们从细节讨论中跳出来。以整体的眼光再度审视评鉴中心。在我们回答评鉴中心是不是一种有效的人力资源管理工具的时候,必须提到下面几个问题:

评鉴中心测量什么?

为什么说评鉴中心有效?

与其他测评方法相比,评鉴中心有什么优缺点?

实施一个评鉴中心要花多少成本?

评鉴中心效用如何,即收益能否弥补(超过)成本?

测评参与者如何看待评鉴中心?

其实,这些问题的核心就是评鉴中心的效度(validity)。这里的效度是指评鉴中心在多大程度上能够实现其既定目标。从技术上讲,任何测评工具都有可能在一定程度上实现人们的目标。而我们所关注的是,所有的证据加起来能不能满足本书对评鉴中心提出的3个要求:界定高级管理岗位所需要的潜能、诊断与工作相关的各种技巧和资质、提供管理培训。

实际上,在前面几章里,我们已经回答了这些问题。例如,在第七章里我们已经说过,评分标准从整体上揭示了管理取得成功所需要的潜能。

各测评指标上的得分准确地诊断出个人的优劣势,这也就在另一方面构成了培训发展的基础。现在,让我们讨论一些更加深入、更加困难的问题。

评鉴中心的各种效度

要回答“评鉴中心测量什么”,必须从经验主义的研究中寻找答案。

我们不能根据一次相关检验或一次文献研究的结果就得出“评鉴中心有/没有价值”的结论。我们必须仔细回顾大量的文献,这些文献的研究内容包括:测评数据与各种参数(包括工作绩效)的关系;不同测评工具对测评结果的影响;时间对测评结果的影响;性别、种族、年龄、评分模式对测评结果的影响等。

为了更好地理解评鉴中心的效度,我们不妨把他们简单分为三类:一是内容效度(contentvalidity);二是效标效度(criteriavalidity);三是建构效度(constructvalidity)。

内容效度

与内容效度相关的信息包括各种测评活动。这里有两个要点:(1)测评材料能否代表员工在现实工作中遇到的情况;(2)在测评过程中应该表现出来的能力是不是现实工作中所要求的。典型的内容效度检测过程就是由专家来评估这两个要求是否得到了满足。检测过程不必涵盖所有的工作内容,只要考察那些重要的和主要的工作范围即可(工业与组织心理学协会,1987)。

在讨论应用于私人企业的评鉴中心的效度问题时,最通常的做法是判断测评演练材料与实际的工作情景的相似性(Gaugleretal.,1990)。扞卫评鉴中心的企业通常都会说:(1)他们在工作分析的基础上选取了测评指标;(2)测评演练活动代表了经常发生的重要工作场景;(3)在测评演练活动中表现出来的行为能够被归入相应的测评指标(当然,这些测评指标都与工作业绩相关);(4)测评师都经过培训,他们能够准确一致地观察测评对象的各种行为表现。收集证据来验证内容效度并不是一件容易的事情。1987年,Sackett指出,在验证评鉴中心的内容效度的时候,我们不能只关注前面这几点,以下内容也得重视:向测评对象介绍的各种背景信息;测评时使用的评分系统;测评结果的解释方法等。之所以要强调这些内容,是因为它们会对评分产生影响。

如果人们希望通过测评来了解测评对象的知识技能水平,内容代表性就可能很高。因此用于诊断当前培训发展需求的评鉴中心(比如,第2章提到的金波利兄弟制造厂)和用于衡量候选人工作能力的评鉴中心的内容效度相对较高。

《评鉴中心操作指南和伦理问题》(TaskForce,1989,参见附录)所设计的评鉴中心充分考虑了内容效度问题。这篇文章的作者是研究和应用评鉴中心的顶尖高手。他们代表了这个领域的最新进展。这篇文章向我们介绍了评鉴中心应有的操作规范,尽管早期的评鉴中心——甚至包括某些最近实施的评鉴中心,有许多都并没有这样做。评鉴中心的设计人员在设计时遵循以下工作步骤显得至关重要:详细的工作分析,界定测评指标,设计能够体现出相应测评指标的演练情境,培训测评师,建立评分系统,最后是设计信息整合系统。这些步骤对于内容效度是至关重要的。

Sackett(1987)对评鉴中心用于测量管理潜能时的内容效度检验程序提出了质疑,随后,又有人站出来反对他的观点(如,Norton,1981)。在我看来,要检验内容效度就必须先了解评鉴中心的操作过程。况且,统计研究的结果也表明,评鉴中心能够准确预测对象未来的管理业绩。

预测效度

即使是最严厉的批评者也不能否认,总的来说评鉴中心的测评结果能够预测未来的管理成就。表9.1总结了若干关于测评总结果预测效度的研究结果。其中,最早的是1970年Byham发表在《哈佛商业评论》上的一篇研究论文,最晚的是1987年Gaugler,Rosenthal,Thornton和Bentson发表的的一份统计分析报告。

总而言之,对测评总结果预测效度的评价为0.40。这就表明,在评鉴中心里得分较高的人通常会在工作中比较成功,而得分较低的人则反之。表9.2清楚地说明了评鉴中心的预测效度。1965年起的研究表明,测评结果认为能够升到中层管理岗位的大学毕业生里,有48%的人的确坐到了这个位置上;测评结果认为不能升到这种岗位的大学毕业生里,只有11%的人升到了这个位置。在未接受大专院校教育的人群里,这两个数字OAR能够找出那些步步高升的管理者。从测评结果来看,成功管理者的得分高于不成功的管理者。OAR与业绩的相关系数范围从0.27到0.64。

OAR与业绩的相关系数为0.33,与潜能的相关系数为0.63,与职业晋升的相关系数为0.40。

OAR能够预测职业晋升情况、业绩水平等。

统计分析的结果表明OAR与工作业绩的相关系数为0.43。

统计分析的结果表明OAR与一系列才能指标的相关系数为0.41。

统计分析的结果表明OAR与晋升、工作业绩评价等的相关系数为0.37。

更加戏剧化:分别为32%和5%。8年甚至16年后,预测效果愈加显得准确,也就是说,越来越多的据说能够升到中层管理岗位的人被说中了。当然,16年后,也有许多原来不被看好的大学毕业生得到了提拔。

这里纯粹是对预测效度的研究。在研究过程中,测评结果并未泄漏给任何企业,也从没有人根据它来制定人员晋升决策。

这些数据清楚地说明了评鉴中心是有效的,换句话说,测评总结果与现实成就高度相关。需要说明的是,上面用到的研究结果有的已经公开出版了,有的则没有;有些研究是出于纯粹的学术研究目的,有的是出于个别企业的使用目的;某些研究还包括了许多因素,既有管理级别的提升情况,也有培训效果或工作业绩的评价,甚至还有独立研究人员对工作效率的观察和研究。因此,我们无需怀疑这些研究的代表性和公正性。

评鉴中心效度差异研究

并不是所有的评鉴中心都具有相同的预测效度水平。现在,人们还无法确定究竟是什么原因使得评鉴中心显得比其他测评方法更加有效。1987年,Gaugler等人对评鉴中心效度的统计研究给我们提供了非常有价值的信息。正如我们在第7章中讲到的,测评结果的预测效度为0.37,这里充分考虑了不同的研究方法以及统计方法(如样本量)带来的影响。需要着重强调的是,有效水平在0.37上下浮动的空间很大:有的仅仅0.25或0.15,也有的高达0.55或0.65,标准差(standarddeviation)为0.12。标准差是对相关系数差异的研究,它表明相关系数在多大程度上偏离了0.37这一平均值。我们在0.37周围建了一个置信区间(confidenceinterval)。例如,下限0.21与上限0.53之间确立出90%的置信区间。这就意味着,我们可以在90%的程度上相信测评结果与实际成就的相关系数不低于0.21。

如果评鉴中心设计得好,我们可以认为它的准确性达到0.53,甚至更高。

我们可以从上述事实中总结出两点结论。一是对测评总结果的预测效度的肯定,换言之,我们可以通过研究大量的评鉴中心来得出这种测评方法有效的结论;二是从过去的研究结果来看,测评总结果的预测准确度差异很大。这表明,影响评鉴中心预测准确度的主要因素并不是研究方法本身。

那么,究竟是什么因素影响了评鉴中心的准确性呢?1987年,Gaugler等人深入地研究了这个问题。他研究了与效度相关的各种变量(当然,某些变量很难研究清楚)。从图9.1可以看出,随着演练项目数量的增加,评鉴中心的整体效度水平也有所上升。这种趋势非常明显。当然了,即使评鉴中心采用了多种演练形式,其效度水平似乎还是不太让人满意。

大量研究表明,评鉴中心的若干特征都与它的效度有关。用到的测评手段越多,评鉴中心就越有效。由心理学家和管理人员共同担任测评师,或者在测评中包含同级评价,都会提高其有效性。这些研究结果既能够告诉我们哪些因素会影响到评鉴中心的效度,又指出了评鉴中心之所以有效的原因。

另外,Schmitt等人在1990年发表的研究报告中说,情境变量也会影响到评鉴中心的效度。他们研究了一个用评鉴中心在某行政区域(由若干个分区构成)范围内选拔中学校长的案例。这项研究指出,评鉴中心的执行质量对效度有重要影响。具体地说,在本案例中,下列做法都有助于提高评鉴中心的效度:更多地由校长而不是大学教授担任测评;把测评的实施放在几个而不是一个分区内进行;尽量避免与测评对象有过密切工作关系的人担任测评师等。

建构效度

考察建构效度就是要了解测评工具是否反映了企业利益的心理学特征(AmericanEducationalResearchAssociation,1985)。尚没有人对测评内容进行专门的研究,但是,为了揭示测评分数所代表的实际含义,我们还是要回顾大量的相关研究文献。目前能够找到的任何关于测评内容代表性问题和预测准确性问题的研究以及我们在第六、七章已经介绍过的研究成果都是我们要考虑的对象。

读者或者还记得,在第六章里我们说过,测评师要观察测评对象在测评时表现出来的各种行为现象,并把这些行为归入相应的测评指标范围。

任何测评师个人就某一项测评指标在单项测评演练工具的基础上做出的评价都可能不准确。不可否认,用同一个测评演练工具测量不同的指标,所得到的分数难免会相互影响,而且这种影响程度往往会超过我们的心理预期。测评师在各项指标上的打分很容易被“这个人表现不错”或“不好”

的总印象左右。这种情况之所以会发生是由于我们要求测评师在单项测评演练活动结束后就给出分数。这种做法正是行为报告法所不取的。

相反地,如果测评师在完成若干项测评演练活动后才进行打分,其准确性和一致性都会高很多。进一步说,在第七章里我们已经讨论过,测评师之间经过信息汇总和讨论,他们给出的分数就更加趋于一致,也更加准确。最终,我们就会发现,综合了所有测评师在全部测评项目中的意见以后,测评总结果就能准确地预见到未来的管理业绩和晋升情况。

现在,让我们考虑这样一个基本问题:“为什么说评鉴中心有效”。这个问题是Klimosli和Briskner在1987年提出来的。对它的回答可以帮我们清楚地界定下面要讨论的问题。Klimosli和Briskner指出,由于评鉴中心能够预测未来,于是人们就普遍地认为它很有效。但是,为什么这么有效呢?

除了传统的解释,Klimosli和Briskner又总结出了5条理由。

传统的解释:测评师判断出哪些测评指标与工作相关,然后得出一个总的测评结果,这一结果能准确预测未来的管理业绩。

现实的效标污染:评鉴中心花费不菲,于是人们就会想尽一切办法利用现有的发现。测评总结果不可能一直不公布,这些结果需要成为现实工作中的决策依据。各种管理决策,比如晋升、薪,甚至业绩评估都要参考测评结果。如此一来,就人为地提升了测评结果与实际业绩的相关性。

潜在的效标污染:由于测评师常常又是企业管理人员,他们往往和那些搞绩效评估的管理人员持有相同的看法或偏见。测评师或许做出了错误的评价,搞绩效评估的人评价的也许并不是真正的工作业绩。所以,预测效度的计量就难免受到“污染”,以至于这一效度被拔高了。

自我证明:那些被挑出来参加评鉴中心的人多少觉得自己有能力,所以才被选中。他们在测评的时候通常都发挥得很好,接下来又获得了正面的反馈。于是,他们会在工作中进一步提高自己的管理才能,从而证实了测评师当初的判断。

业绩持续性:这里有两种观点。一种观点认为,测评师从测评对象背景资料中获知其过去的业绩信息,这些信息能够预测预测未来的业绩状况。另一种观点是,测评时可以通过测评对象在工作样本中的表现来预测未来的业绩水平。因此,我们完全可以舍弃那些抽象的概念,比如测评指标之类。

管理智力:测评结果反映了测评对象的智力水平,并不是对管理业绩指标的衡量。

评鉴中心有效性的几种解释

接下来,我们要逐一讨论Klimosli和Briskner对评鉴中心有效性的各种解释。同样,也有人反对他们的观点,拥护传统的解释。

现实的效标污染

同类推荐
  • 趣味管理学

    趣味管理学

    本书最大的特色在于“巧”。管理知识和故事结合得巧妙,赋予管理学以趣味。将枯燥的管理学方法用讲故事的形式表现出来,会增加其趣味性、可读性和认知性。同时,将管理知识进行系统的分类,基本上按照经典管理学逻辑体系进行编排,也弥补了其他管理故事中“见事说事”的缺点和不足。
  • 世界五百强企业的“压力”法则

    世界五百强企业的“压力”法则

    本书主要讲述压力存在的必要性、压力的来源、如何减压、如何增压、如何调节压力等内容,以“压力”为关键词,讲述了我们如何能够一张一弛的利用压力,让身边的压力有益于我们的工作业绩提升,有利于我们轻松快乐的生活。
  • 老板可以这么当

    老板可以这么当

    本书以对话体的形式很好地架构起作者与企业家之间交流的平台。内容涉及企业战略、营销战略、人力资源等企业发展的各个方面。
  • 闽南民企的百亿与百年

    闽南民企的百亿与百年

    百亿,一个闽南民企难以逾越的“龙门”;百年,一个华夏民族富不过三代的“咒语”!如何突破?针对闽南民企的现状,本书作者根据十几年的咨询工作及在上海、浙江和闽南民营企业中的中高层管理实践经验,从探讨“闽南民企的核心竞争力”入手,明确指出,品牌、技术、资金、渠道和人才等等单一因素都不可能真正助力闽南民企做大做强,要实现“百亿”和“百年”,闽南民企必须着眼于“现代化管理机制”的构建,这才是王道。
  • 《水浒》是本管理书

    《水浒》是本管理书

    说《水浒》是本管理书,一点也不夸张,因为它暗含了团队管理的三大难题。宋江,文也不能文,武也不能武,无形象、无学历、无背景,他却能领导梁山好汉扯旗造反,轰轰烈烈地开展“山寨事业”……为什么?梁山公司,一个县处级单位,居然有36个正处、72个副处。这100多个高管(高度难管),品流复杂,野性难驯,动辙来个亲密接触,搞点流血事件。可是在宋江的安排下,梁山公司秩序井然,人人爱岗敬业,充分发扬团结协作的精神……为什么?梁山公司的领导更替,充满了十足的火药味儿……为什么?答案就在《水浒》中,就看你能不能发现。幸运的是,赵玉平已经帮我们找到了答案,我们不用熟读《水浒》,就能从根本上解决这三大难题。
热门推荐
  • 爱你,可念不可说

    爱你,可念不可说

    他是A市叱咤风云的人物,无所不能,却唯独无法找到那个已死之人的影子。我是在死亡和痛苦夹缝中挣扎的女人,一无所有,却设计接近他,让他爱上了我。起初,他说:既让人恶心,又贪恋钱财。我很想看到你死得难看的模样。后来,他说:你真是个可恨又让人心疼的女人,但,却别妄想替代她。到最后那一天,他说地哽咽:沐荿,我骂过你,伤过你,爱过你,恨过你,也想过你,却唯独没有想过忘记你……都说,我只是流连意大利建筑边的风景,可我只是钟情于那日余晖下,烂漫绽放的玛格丽特,无法自拔。
  • 学弟不乖待扑倒

    学弟不乖待扑倒

    “江承息,我比你大一岁,快叫姐姐!”面前高冷的小正太扭头冷冷地说了一句“白痴。”转身走了。于是,从六岁第一次见到江承息起,让他叫我“姐姐”就成了我人生第二大目标。第一大?当然是扑倒啦。看万能学姐如何扑倒羞涩傲娇小学弟。
  • 花月冷魄

    花月冷魄

    缘起帝宇,杀手穿越成镇国府三小姐,月凰的堕落,让她沉醉,桃林的纯美,又使她渐醒;涅槃重生,接受了血魔盅的力量,让她变的嗜血,仇恨让她兴奋,使她对爱情麻木;月影沉浮,多少相思多少离愁苦;血歌泪祭,千年爱恨纠缠,终与谁执手天下!情节虚构,请勿模仿!
  • 历史典故(下)(青少年必读书系(小学卷)(中学卷))

    历史典故(下)(青少年必读书系(小学卷)(中学卷))

    以史为镜,可以知兴替。每一则历史典故都是寓意深长的教育篇章,从历史典故中你能知道如何做事,你能知道如何做人,你能知道很多你必须知道的知识,特别是从那千锤百炼中反映出来的诗人作家、有识之士的高风亮节、学子们的刻苦学习精神等。
  • 月光凤凰

    月光凤凰

    这世界上并不是只有黑与白,人性也不是单纯的只有善与恶。欲望是无法得到的邪恶,正义掩埋在阴谋之下。在传说中的托里斯大陆里,创世父神失踪之后诸神为了争夺信世界的掌管权展开了激战。此时,在他们所不知道的地方里出现一股强大的力量,最后诸神联合起来打败了这股力量并封印了邪恶的头领。战争结束了,诸神的力量也受到了重创,于是在神的名义下人类替代神灵管理大陆。数千年的沉寂以后,邪恶的力量开始苏醒并且开始召集力量,整个托里斯大陆再次笼罩在阴霾之下......
  • 封魔界

    封魔界

    这是一个崩坏的世界,而造成这般的原因是那充满着无数妖魔,凶兽等等邪恶存在的封魔界的出现,随着封魔界的出现,那些古老的修炼者们纷纷出世来维持这崩坏的世界,此时一名少年随之脱颖而出,但是一场天地大劫难随之而来,少年在这大劫中是生是死,是超脱其中还是转入轮回,敬请期待!!!!
  • 穿入小说之玩转修真

    穿入小说之玩转修真

    穿入自家小说,成为反派人物。开启任务系统,玩转修真世界。且看林浩在南阎浮洲,如何凭借对人物动向的了若指掌,对宝藏密境的无所不晓,一步步成为将正派踩在脚下的大魔头!--------这是一个诙谐幽默的仙侠故事,希望诸位读者喜欢。
  • 末世之黄昏崛起

    末世之黄昏崛起

    我本来只想做一个平凡的人......我本来就没想过站在上帝的视角去看待世界.......当命运交响曲奏响时,米路微眯眼睛,伸出右手“啪”的一声打了一个响指对着身后的“人们”道“我们的时代来临了!”
  • 异世催眠

    异世催眠

    一个穿越到古代的催眠师,做了几年小偷,遇到了风起云涌的年代……
  • 女人30优雅地熟透

    女人30优雅地熟透

    本书从修养、仪态、职场、情感、家庭婚姻、健康、美容等方面,论述了当代30岁女人如何直面人生、自我呵护、勇敢追求、不断努力地塑造个人魅力,实现人生价值。