登陆注册
13851200000019

第19章 学习(2)

第三节操作条件作用

对操作条件作用(instrumental conditioning)学习理论贡献最大的是行为主义心理学家桑代克和斯金纳。

一、操作条件作用原理

(一)操作条件作用的实验设计

在巴甫洛夫用狗研究经典条件作用的同时,美国的一位心理学家桑代克正在用猫做不同的实验(Thorndike,1898)。他把饥饿的猫放入迷箱,食物放在箱子外面,箱子的门用几道门闩锁起来。在箱子某处安置了一个机关。猫为了获取食物对栏杆咬、抓、踢、挤均无效时,经过多次尝试错误,最后偶然碰巧触到了机关,做出了正确的行为,门打开了才出箱吃到食物。随着实验次数的增加,猫解决问题的速度也逐渐提高。根据上述实验,桑代克提出了自己的学习理论。其学习理论有两个要点:一是尝试错误学习(trial and error learning)理论,认为学习的实质就是尝试错误的过程。在问题情景中,个体会表现出多种尝试性的反应,直到一个正确反应将问题解决为止。在这些尝试中学到能获得满意结果的特定反应之后,其他无效尝试的反应就不再会出现。二是效果律(law of effect),一个反应再次发生的可能性大小由这个反应的效果决定。如果某种反应能够引起满意的结果,此行为就会被保留,学习就会发生;反之,如果某种反应不能引起满意的结果,这种反应就会削弱,此行为再次发生的概率就会降低。这就是桑代克所说的效果律。

斯金纳在桑代克研究的基础上进行了更深入细致的研究,提出了操作条件作用理论。在斯金纳的实验中,他研制了一个特殊的箱子,箱内有一与箱外联系的杠杆,杠杆下有一食物盘。如果杠杆被压下,指示灯就发亮,并有食物从外面落入食物盘中。这个装置就是著名的“斯金纳箱”。实验时,斯金纳将小白鼠放入箱中,开始小白鼠只会到处乱跑,偶然地会将杠杆压下,这时指示灯会亮一下,并有食物送入盘中,小白鼠便得到食物。小白鼠压杠杆是一种自发的行为,斯金纳把这种行为称为操作性行为。操作条件作用原理与和尝试错误作用理论相似,只是斯金纳用强化作用原理取代了桑代克的效果律。实验发现,出现食物是一种强化,是对白鼠操作行为的鼓励。在偶然压杠杆得到食物后,按压杠杆的操作行为就增多,但如果小白鼠压杠杆后不再得到食物,即没有得到强化,操作行为就会逐渐消退。

操作条件作用是指有机体学会把反应和结果联系在一起的过程。操作条件作用的实质就是从结果中学习。与经典条件作用一样,操作条件作用也可以用联结学习的原理来解释。只不过,在经典条件作用中是两种刺激的联结,任一种刺激都能引起同样的反应。而操作条件作用是刺激情境和特定反应之间的联结,即S-R联结。操作条件作用和经典条件作用的最大区别是,前者的学习个体主动地“操作”环境,属于“自发型”行为;后者的学习个体是被环境所控制,是属于“应答型”行为。

(二)操作条件作用中的强化

个体在学习情境中,影响行为巩固或再次出现的关键因素是行为的结果。如果行为的结果使反应发生的概率增加或维持在某种水平,则此结果被称为强化物。强化就是指在个体反应之后呈现强化物。

1.强化物的种类

对于人类来说,强化物可以是多种多样的。如果你完成某项任务,请你吃一顿饭是强化,用赞许的目光看着你,对你点点头也是强化。可以这么说,强化物是有机体认为有价值的任何事物或活动。一般把强化物分为三类,即一级强化物、二级强化物和反馈。

(1)一级强化物

一级强化物是自然形成的,非后天习得的,能产生舒适感或消除不适感,或能够满足即时的生理需要。如食物、水、药物和电击等都是一级强化物。比如,人感到热的时候会打开风扇或空调,饿的时候会到冰箱去寻找食物,下雨的时候会穿上雨衣或撑起雨伞,身体不适就会服药,这些行为都是受一级强化物的影响。

一级强化物有时是肉眼看不到的,比如我们跑步或进行其他剧烈体育运动时,脑内一种神经递质——内啡呔的水平会提高,使人体验到一种愉悦感,这种结果会促使跑步行为的再次发生。有心理学研究者在小白鼠脑中的特定区域植入微电极,可以刺激大脑中的快乐中枢(pleasure center)。研究者将小白鼠放入斯金纳箱中,训练小白鼠按压杠杆。每次小白鼠按下杠杆,就会接通电流,从而刺激它大脑中的快乐中枢,获得愉悦感。研究发现,许多小白鼠每小时能按压几千次!并且能够连续按十几个小时,直至因疲劳而晕倒为止。一旦苏醒过来后,又会去不断地按杠杆,全然不顾对食物和水的需要。

(2)二级强化物

金钱、奖章、赞扬、关注、成功以及其他奖赏都可以成为强化物,这种已超出了满足生理需要的强化物称为二级强化物。二级强化物是通过后天学习形成的。如幼儿园老师经常用小红花或红五角星来鼓励孩子们的上进心,或促使孩子们养成良好的习惯。每天,世界各地都在举行大大小小的评奖活动,这其实都是在利用二级强化物对人的行为施以影响。

此外,二级强化物也可以作为“代币”发挥作用。比如精神病院中的“代币”管理制度。凡是精神病患者能够保持个人卫生、积极配合医生的治疗,就可以定期得到一定的奖券,患者可用不同数量的奖券“兑换”他们想得到的物品。“代币”也可以用来提高孩子的学习积极性,比如家长可以规定,如果平时作业成绩得到十个“优”,就可以答应孩子玩几个小时游戏。许多网上论坛或博客网站采用等级制来提高人们再次浏览的可能性,实际上也是在遵循这个原理。

(3)反馈

反馈也是一种强化物。心理学家发现,通过信息反馈,即知道行为的结果,就可以提高学习的成绩。作为一种强化物,反馈在电子游戏里是最常见的。许多人喜欢玩电子游戏是因为游戏中设计了很多级别,每个级别中又会有许多步骤,玩家每完成一个步骤就会有分数反馈回来,同时也会显示其所达到的级别。往往在没达到最高级别之前,一局游戏已结束,玩家要想得到更多的反馈,只能继续玩下去。再比如,电视上各种娱乐节目中的比赛实行计分制也是这个道理。运动员在平时训练中如果能及时得到反馈也会收到很好的效果。朋友间的一些娱乐活动在计分情况下会玩得更带劲。

此外,那些学习努力或工作勤奋的人似乎总有某种动力在激励他们。实际上,他们通过学习或工作达到一个目标,或达到一个距离理想目标更近的目标,这些目标的实现就是一种信息反馈,就是他们努力行为的强化物。

2.强化类型

按不同的分类方式,强化分为正强化和负强化,连续强化和部分强化。

(1)正强化和负强化

正强化是指一个反应之后伴随着一个愉快的结果出现。如某人的笑话赢得了朋友的笑声,那么这个人下次在众人面前讲笑话的可能性就会增加。体育健儿通过努力获得奥运奖牌是一种正强化。买彩票中奖和赌博赢钱也属于正强化。

负强化是指一个反应之后可以消除一个不愉快事件。如在一个特制的斯金纳箱中,小白鼠只有通过按压杠杆才能逃避电击(不愉快事件),很快小白鼠就能学会按压杠杆逃避电击。再比如,我们可以通过吃东西消除饥饿,通过吃止痛药缓解疼痛。在日常生活中,有些家长通过体罚孩子阻止孩子的吵闹行为,其结果进一步强化了家长的体罚行为。

吸毒成瘾过程可以同时说明正、负强化这两种现象。在个体成瘾初期,由于个体通过吸毒能够体验到一种欣快感,这种欣快感会强化个体进一步的吸毒行为,这种强化属于正强化。到了成瘾后期,不吸毒品,个体就很难受,吸毒可以消除这种痛苦的感受,这种负强化就增加了个体的吸毒行为再次发生的可能性。

(2)连续强化和部分强化

通过负强化所获得的反应行为不会很快消退,正强化所获得的反应行为消退的快慢与其习得时所采用的强化时间模式有关。这种模式分为连续强化和部分强化。连续强化是指只要个体表现正确就给予强化。部分强化是指在部分正确反应之后给予个体强化。与连续强化相比,部分强化所习得的反应不易消退。其中,部分强化又分为固定时间强化、不定时间强化、固定比率强化、不定比率强化。

固定时间强化是指对于个体的正确反应,经过一段固定的时间间隔之后给予强化。按月给员工发薪水就是这种强化模式。不定时间强化不是在个体每个正确反应之后都强化,强化之前所经过的时间间隔会有所变化。商家不定期的促销活动就是利用这种强化模式来强化人们的购买行为的。固定比率强化是指个体在做出一定数量的正确反应后给予强化。如计件工资的方法就属于这种强化类型。不定比率强化是指根据个体做出的正确反应数量实施强化,但要求每次的数量有所变化。比如,彩票中的偶尔中奖,在赌博中赢钱及人们的一些迷信行为就属于这种强化类型。

这四种强化类型中,不定时间强化和不定比率强化所形成的反应最难以消退,其次就是固定比率强化,固定时间强化所形成的反应最易消退。

心理学实验室习得性无助实验

1975年,心理学家塞里格曼做了一个实验。他把狗分为两组:一组为实验组,一组为控制组。

先将实验组的狗放在一个笼子里,狗无法逃脱这个笼子。笼子里有电击装置。给狗施加电击,电击的强度能够引起狗的疼痛,但不会伤害狗的身体。实验者发现,一开始,几只狗被电击时拼命挣扎,想逃脱笼子。经过再三努力,狗发觉仍然无法逃脱后,挣扎的程度就逐渐降低了。

随后,把这几只狗放进另一只笼子。这个笼子由两部分组成,中间用隔板隔开,隔板的高度是狗能轻易跳过去的。隔板一端有电击,另一端没有。面对如此容易逃脱的环境,它们却试也不去试一下,就已绝望地接受了无法逃脱的“现实”。

而将对照组中的狗(即那些没有经历过前面第一个实验程序的狗)直接放进后一个笼子里,发现它们全部能逃脱电击之苦,轻而易举地从有电击的一边跳到安全的一边。

实验组的狗由于曾经有过被电击而无法逃脱的经历,所以很快就放弃了挣扎,放弃了逃脱的希望。这是和操作条件作用原理有关的一个习得性无助的例子。在现实生活中,因经常遭遇挫折而形成自卑情绪的人比比皆是。要想克服这种自卑感,就需要树立信心,给自己感受成功体验的机会。

(资料来源:陈书凯《动物实验的人生启示》,哈尔滨出版社2004年版,第2-3页)

(二)操作条件作用中的惩罚

1.惩罚的概念

惩罚也是控制人们行为的一种方法,比如体罚、批评、罚款、解雇或剥夺某种权利等。与强化相反,惩罚是为了降低某种反应再次发生的可能性。一个操作反应的消退既可以采取不加以强化的办法,也可以采用惩罚。例如,想阻止一个孩子通过哭闹来要求家长买玩具的行为,可以不理睬他,也可以批评他或取消他一周的零花钱。

惩罚也分正、负两种。正惩罚是指直接惩罚,即在某一行为之后出现讨厌的刺激,直接令人不愉快。如汽车司机因违章而被罚款。负惩罚是指反应代价,即当某一行为之后喜爱的刺激被取消。比如在一些电视娱乐节目中,回答错误会取消参与者继续比赛的资格。

同类推荐
  • 朝花夕拾·野草

    朝花夕拾·野草

    本书作于1926年,共10篇,前5篇写于北京,后5篇写于厦门。最初以《旧事重提》为总题目陆续发表于《莽原》半月刊。1927年,鲁迅在广州将本书重新编订,写《小引》、《后记》,并改名为《朝花夕拾》,本书是了解与研究鲁迅早期生活、思想和当时社会风貌的重要艺术文献。
  • 青少年应该知道的科技知识

    青少年应该知道的科技知识

    《青少年应该知道的知识小百科》共12册,是专为中国青少年量身定做的一套全方位知识图书。《青少年应该知道的知识小百科》涵盖了青少年成长过程中不可或缺的历史、科技、军事、文化等不同领域知识精华。本丛书旨在启发青少年学习积极性,积极引领中国青少年朋友走向未来,使青少年朋友们能够在轻松与快乐中学习知识、健康成长,是广大青少年学习新知识的理想读物。而这本《青少年应该知道的影视艺术知识》更是系统全面讲解影视知识,使青少年轻松学会。
  • 2008年高考满分作文

    2008年高考满分作文

    精心撷选2008年全国高考考场满分100多篇有多年高考实战经验的一线教师透彻点评得分要点引领你揣摩成功心得,掌握满分门径,轻松胜出。
  • 创新型人才素质教育

    创新型人才素质教育

    当今世界是一个多层次生产力的发展局面。由于生产力发展水平的差异,国家与国家之间、地区与地区之间在经济和文化领域形成了巨大的差距。而这种差距首先是开发创新能力的差距,也就是创新的差距。创新,是一个国家、一个民族屹立于世界之林的最有力的“武器”。历史证明,创新是一个民族进步的灵魂,是一个国家兴旺发达的不竭动力。
  • 上市公司定向增发新股:理论与实证研究

    上市公司定向增发新股:理论与实证研究

    本书共分为9章,全书的研究框架以及研究的创新点;介绍迄今为止国内外学者关于企业选择股权融资还是债务融资的相关理论;介绍中国上市公司定向增发新股的政策以及定向增发新股的上市公司的特征;介绍美国等证券市场成熟的国家上市公司定向增发新股的经验等。
热门推荐
  • 武道纵横

    武道纵横

    神、魔、人三界纷乱不已,霸者横行,弱者哀叹……俗世翩翩少年卓不凡,穿越在一个双料废物身上,惨遭家族逐出……虽然受尽世间冷眼,可他始终热血热肠,尤其接了赏善罚恶令后,更是一心行善……他豪情万丈,见到行凶作恶者,不论天上地下,虽远必诛……他生性多情,穿梭在花丛之间,谁知:本欲将心向明月,奈何明月照沟渠……斗武,斗兽,斗魔,斗神……,他以人性至高无上的光芒,塑造了一段永恒的热血传奇……本书群号:116914335,热诚欢迎书友们加入
  • 神武至尊

    神武至尊

    诸神,拥有天赐血脉,立于苍穹之上,掌控众生命运;林阳,一个平凡少年,却立誓逆天改命!毁灭轮回,扭转生死之宿轮,只为亲情长存;魔阻屠魔,神挡杀神!战诸神,只为坚守一份万古沧桑终不移的承诺。“天既阻我,我便将这天穹纳入掌中。天不容我,我便自创一方宇宙。”
  • 彩虹护花使者

    彩虹护花使者

    江南美女如云,犹如诗情画意!只可惜,战火连绵,弄得家破人忙,民不聊生,人无去向。城堡也一遍又一遍的不停翻修。每当天色阴沉,铺天盖地,鸟无去处,四面八方的气氛总会漂浮不定。十几个大国总会应这样的情景担忧着,都纷纷建立自己的学院,培养下一代人杰辈出,香火得到延续,保住国家。为了减少战争的纠纷,各国的大臣们都纷纷签着“友盟协议”,防止其他国大肆掠夺。尽管签了合同,还是有许多国家违约协议,独占自有。
  • 青春如此

    青春如此

    青春太短,你好难忘。我在青春年少的时节爱上了陆涛,此后他成为了我一生中最大的笑话。
  • 瓮陈尧

    瓮陈尧

    一个天才,不折不扣的天才,在这个和平的年代,却要去拯救突然陷入危机的世界,一场惊心动魄的大戏即将上演,且看天才是如何拯救这个世界的!
  • 酸枣树

    酸枣树

    《酸枣树》由赵桃山著,小说以主人公周昊天与3位女性的爱情婚姻、悲欢离合以及事业沉论为主线,描写了太行山区城乡的沧桑巨变。在歌颂新中国成立以来特别是改革开放以来翻天覆地、日新月异、蒸蒸日上的辉煌成就的同时,鞭挞了现实社会中存在的丑恶现象。《酸枣树》适合文学爱好者阅读。
  • 米粉的100种做法

    米粉的100种做法

    米粉以汤粉、炒粉为主,酱料介绍了蒸酱、蘸酱、拌酱等,五谷杂粮有红薯、玉米、豆类等,火锅则介绍了各种底料的搭配,款式新颖,品种丰富,非常适合家庭主妇、烹饪爱好者使用。
  • 偃溪广闻禅师语录

    偃溪广闻禅师语录

    本书为公版书,为不受著作权法限制的作家、艺术家及其它人士发布的作品,供广大读者阅读交流。汇聚授权电子版权。
  • 人体装甲

    人体装甲

    新的时代新的军备应势而生:机械太阳聚能炉,反磁场引擎,光束散射炮,光能坦克,取代石油的金韧树油等等,一场场先进军备的较量相继上演。具备高度机动性,大规模杀伤力的人体装甲亦同期诞生,似乎掌握人体装甲开发能力的人便能座拥天下,而装载人体装甲的人便能轻易击败各种军备。
  • 巨胜歌

    巨胜歌

    本书为公版书,为不受著作权法限制的作家、艺术家及其它人士发布的作品,供广大读者阅读交流。