讲读《学习论》第四章斯金纳操作学习理论
2010-08-31
今天的悦读课我要讲读的是《学习论》一书中第四章斯金纳的操作学习理论。斯金纳是当今心理学界最重要和最有影响的人物之一。他是一位有想象力的和富于创造力的科学家。很少有美国心理学家对心理学的发展有过如此深刻的影响。1958年他获美国心理学会授予的杰出科学奖;1968年获美国政府颁发的最高科学奖-------国家科学奖;1971年获美国心理学会基金会颁发的金质奖章。他一身最大的贡献是提出了操作性条件作用的原理,设计了用以研究操作性条件作用的试验装置--------斯金纳箱,并对各种强化程序他安排的效果作了详细而又比较科学的考察。他根据强化原理所设计各种应用性技术(如塑造和渐退的方法),不仅使实验室动物行为发生了变化,而且被广泛应用于人类的社会情境。例如,在心理治疗、问题儿童的处理、智力迟钝儿童的教育、课堂管理等方面都有一定的成就。
第一节 斯金纳操作性条件作用的基本观点
一、对行为的实验分析
斯金纳重点放在对行为的实验分析上。所以,研究行为的目的,是要形成一种分析各种环境刺激的功能和方法,以决定和预测有机体的行为。为此,斯金纳设计了一种特殊的仪器:斯金纳箱。一个很简单的箱子。他反对复杂的迷津,因为太复杂无法确定行为的各种基本规律。这是一个阴暗的隔音箱,箱子里有一个开关(如用白鼠,即是一个小根杠杆或一块木板;如以鸽子,就是一个键盘)。开关连接着箱外的一个纪录系统,用线条方式准确地纪录动物按或食物的释放方式由实验者决定。除此之外,还可以控制灯光、声音、电击、温度与湿度等。斯金纳箱的特点是,动物可以反复作出“自由操作的反应”。所谓“自由”,即动物的行为不像在迷津里那样受到限制;所谓“操作”,是因为动物的反应是主动作用于环境。
行为的实验分析关注的是环境事件(刺激)与有机体行动(反应)之间的关系,就是考察实验操作是如何引起行为变化的。斯金纳认为,可以用三种基本的实验操作来控制环境:呈现刺激、安排结果、信号刺激。这些方法为分析学习过程提供了有效的基础。
1.呈现刺激:是一种最简单的实验操作。当我们呈现刺激时,就可以观察到它们促使有机体产生的反应。例如,给白鼠食物可以引起唾液分泌,如果接着给予电击,就可以使它停止唾液分泌,并跳起来。
2.安排结果我们可以安排各种环境,使有机体的反应具有效果或结果。
3.信号刺激:我们在呈现刺激或安排结果时在再予其他的刺激,那事情就会复杂得多。在这类实验中,一种刺激被用来作为预示另一种刺激即将来临的信号。例如:我们可以在铃声响时给予食物,或在灯亮时给予电击,这类实验安排类似于巴浦洛夫的实验。但是,我们也可以为反应结果安排这类信号刺激。例如,白鼠只有在灯亮时站起来才给食物。这样,白鼠就会只在灯亮时站起来,等不亮时不站起来。又如,我们只在铃响时对白鼠舔尾巴的动作给予电击,这样,白鼠就会在铃响时不舔尾巴,而在没有铃响时照样舔尾巴 。
二、两种类型的学习:
斯金纳在解释学习时,几经看到了巴浦洛夫、华生等人对学习的解释。他认为景点条件作用只是解释了人类与动物的数量有限的行为。这些早期的学习理论只能用来解释这样一种习得行为:用某种刺激可以引发某种反应。没有刺激就没有反应,是传统的刺激反应理论的一句名言。
1、第一种学习模式:S(刺激)类条件作用
斯金纳把由刺激引发的反应称为“应答性反应”;它是一种不随意的行为。有机体是被动地对环境作出反应;经典条件作用只能用来解释基于应答性行为的学习,斯金纳把这类学习成为S(刺激)类条件作用。
2、第二种学习模式:R(强化)类条件作用
他把有机体发出的反应称为“操作性反应”。操作性是随意得到或有目的的行为。斯金纳认为人类绝大多数有意义的行为都是操作性的。比如:步行上学、读书写字、回答问题等。在操作性行为中,有机体是主动地作用于环境。操作性或工具可用来解释基于操作性行为的学习,他称为R(强化)类条件作用。
应答性反应是被动的,就比主动的操作性反应逊色得多。
操作条件作用的模式认为,如果一种反应-----不管有没有引起这种反应的刺激------之后伴随一种强化物,在类似环境里发生这种反应的概率就增加。而且,强化物与实施强化的环境里发生这种反应的概率就增加。而且,强化物与实施强化的环境一起都是一种刺激,我们可以以此来控制反应。这样,任何作为强化的结果而习得的行为,都可以被看做是操作条件作用的例子。人们由此把斯金纳的理论称为强化理论。在斯金纳看来,重要的刺激是跟随反应之后的刺激,而不是反应之前的刺激。公式:S-R-S。
第二节 斯金纳的强化原理
斯金纳所要重点研究的是:强化的类型和强化的安排是如何影响学习的。
一、 强化的类型:
1、两种:正强化、负强化。当在环境中增加某种刺激,有机体反应概率增加,这种刺激就是正强化物。例如,当饥饿的白鼠按开关时给予食物,食物便是正强化物。当某种刺激在有机体环境中消失时,反应概率增加,这种刺激便是负强化物。负强化物就是厌恶刺激,是有机体力图避开的那种刺激。例如,当处于电击状态下的白鼠按开关时停止电击,停止电击就是负强化物。无论是正强化物还是负强化物,它们的结果都是增加反应概率。
2、强化物包括:一级强化物和二级强化物。一级强化物包括所有在没有任何学习发生的情况下也起强化作用的刺激,如食物和水等满足生理基本需要的东西。二级强化物包括那些在开始时不起强化作用,但后来作为与一级强化物或其他强化物配对的结果而起强化作用的刺激,如斯金纳箱的灯光、铃声。对人类来说,二级强化物包括对大量行为起强化作用的许多刺激,诸如特权、社会地位、权利、财富、名声等。
在斯金纳的体系中,强化只是一个用来描述反应概率增加的术语,如何安排强化才是核心。
二、 强化的安排:
从某种意义上说,斯金纳在强化安排方面的实验,是他对心理学的最大贡献。斯金纳认为,在行为实验分析中,最容易控制的、最有效的变量是给予强化的方式。在一种仔细控制的实验情境中,实验者可以精确地使用什么类型的强化,以及怎样给予、何时给予强化。实验者完全可以控制强化程序。
强化的安排可以有两种选择:1、连续强化,每一次正确反应之后都给予强化。2、间歇强化,并不是每一次正确反应之后都给予强化。
如果实验者选择连续强化,那就没有其他选择了,只要每次正确反应之后都给予强化便是了。如果实验者选折间歇强化,他又两种选择一种是比例强化安排:根据一定比例给予强化,例,每5次正确反应给予一次强化。另一种是间隔强化安排:根据一定时间间隔给予强化,例:每5分钟正确反应给予一次强化。
根据刚才的两种选择还可以再根据固定方式还是变化的方式给予强化。有四种 情况 :固定比例强化安排(每5次 正确反应后给予一次强化)变化比例强化 安排 (在 20次 正确 反应 期间 给予 4次 强化,至于强化何时给予 ,那是随机的。)固定间隔强化安排(每隔正确反应5分钟给予一次强化)变化间隔强化安排(在正确反应的20分钟期间给予4次强化,至于强化何时出现,那是随机的)见表一
以上任何一种强化安排都可以和其他强化安排结合起来使用。例如:我们可以先采用连续强化安排,然后采用间歇强化的安排。那就是组合安排。斯金纳研究出了20多种强化安排的结果。
三 不同强化安排的效果:
这些强化安排对几种学习侧度的影响:
1. 对习得速度的影响
一般说来,如果最初学习时给予连续强化,即每一次正确反应都给予强化的话,学习的速度就会比较快些。如果最初学习时使用间歇强化,(不是每次正确都给予强化)学习就会困难些,速度也就慢一些。斯金纳使这样训练动物学习的:先把一种要求习得的复杂的行为反应分成若干比较简单的反应,分别予以强化。例如:先训练动物到食物槽里吃东西,然后学习识别暗箱中发生的声音,最后把这种声响与食物即将到来联系起来。当动物掌握这些“分解了的”反应后,再把它们合起来。这时,所有正确的反应都给予强化,目的是为了使动物尽快地掌握操作技能。
2. 对反应速度的影响
反应速度是对强化安排相当敏感的一个因变量,因此,斯金纳花了相当多的精力来研究这个问题。
第一, 一般说来,比例强化安排比间隔强化安排的反应速度要快些。这种差异并不奇怪,因为在特定时间内,在比例强化安排时,快速的妇女应会增加强化的数量。而在间隔强化中,快速反应只能是早一点获得每一次强化而已。
第二, 在连中固定强化安排中,在每次强化后,反映速度立即变慢。原因是由于强化之后即便立刻作出反应,也不可能得到强化。这在固定间隔强化安排中表现得更明显。因为有机体在这个间隔期间,反应得不到任何强化,所以,反应的速度是从这一次强化后到下一次强化前有规则地逐渐加快的。由于这种图解很像海里的扇贝,因此把它称为“扇贝型”效应。斯金纳解释道,有机体在间隔期间反应速度逐渐提高,而不是正好在下一次强化前突然加速,是因为有机体不能精确地辨别时间的缘故。
在固定彼列强化安排中,强化次数与反应次数比例的高低,对动物的反应速度由很大关系。一般说来,固定比例低的强化安排,在强化后反应速度不大会减慢;而比例高的强化安排,在强化后反应会较长时间的暂停。这种暂停往往是在一段时间里反映整个停止。在这以后,以相当同样的速度作出反应,知道下一次的强化。因此,这种反应形式不同于固定将钱花安排时出现的“扇贝型”———逐渐加快反应速度。
最后,在连词强化之间反应速度的这些便是,只表现在固定强化安排着那个,在变化钱花安排中则没有呈现这种现象。因为在变化强化安排中,不论是早是晚,都有机会得到强化,所以反应速度基本上是相同的。
3、对消退速度的影响
连续强化安排比间歇前后安排习得的速度要快些,但在不给强化后,导致消退的速度也会更快些。其次,固定强化安排比变化强化安排引起的习得速度要快些,但在没有强化时 ,它引起的消退速度也会更快些。最后,在比例强化安排中,强化次数与反应次数的比例高,反应速度要比比例低快一些,但在不给强化后,消退速度相应地也要快一些。
所以,最佳的训练组合也许是,最初时使用连续强化安排,然后是固定间隔强化安排,最后是变化比例强化安排。此外,随着训练期的推移,比例也可以改变。总体说来,减少强化对不强化的比例,会导致消退速度放慢。
三、 负强化与惩罚:
许多心理学家和教育心理学著作中,都混用负强化与惩罚这两个概念。斯金纳看来是有本质区别的。惩罚是抑制反应发生的概率,强化是增加反应概率。
斯金纳认为,惩罚有时在改变行为方面是一种有效的方法,但不是一种理想的方法。虽说惩罚会导致反应的减少,但它只是间接地起作用的,它只是抑制而不是消除这种行为。而与此同时,惩罚可能会引起副效应,如攻击性行为。所以,他认为,与其给予厌恶刺激,还不如不给奖励刺激。
他认为在非得给予惩罚时,一定要注意两点。第一,要注意利用惩罚后的反应抑制期。也就是说,要尽可能通过强化加强其他的行为反应。第二,惩罚一定要在不良反应后立即进行,延迟的惩罚可能是无效的。
根据斯金纳的观点,人们围绕惩罚的问题展开了讨论。一些人反对采取惩罚的办法,理由是:第一,惩罚不可能导致适当的行为。事实上,惩罚只能使人注意那些不良的行为,但不表明什么行为是合适的。第二,惩罚并不能消除不良行为,而只是抑制它。受惩罚影响的仅仅是不良行为的反应速度。第三,惩罚可能导致一种消极的情绪状态。这些消极的情绪状态往往是与实施惩罚者而不是不良行为联系在一起。第四,惩罚有时并不起作用。例如,研究表明,对尿床的儿童进行惩罚,更有肯能导致他们尿床;对儿童侵犯行为给予惩罚,更有可能使他们具有侵犯行为。
但是,也有人认为,惩罚至少在抑制不良行为方面是非常有效的。当惩罚看来是减轻危险反应的唯一可行的方法是,惩罚的害处可能要让儿童自身发展下去产生的后果要小一些。主张适当采用惩罚的人,现在常常采用一种被称为“暂停程序”的惩罚办法,即不是通过给予厌恶刺激来惩罚,而是让学习者立刻一种可能会得到强化的环境来惩罚。因此,斯金纳一方面反对惩罚的合理性,另一方面也不否认惩罚在矫正行为方面所起的作用。
第三节斯金纳强化原理的应用
斯金纳的操作条件作用的原理,与他同时代的其他学习理论相比,经受了时间的考验,并很快就流行起来,主要原因是,斯金纳的学说不仅在实验情境中获得了成功,而且在广泛的社会实际情境中得到了应用。
斯金纳强化原理应用的两种技术:
一、塑造:
所谓教育,就是要塑造行为,塑造在不久的将来对个人自己和他人有利的行为。在斯金纳看来,通过各种强化安排来塑造行为,就像雕塑家可以用泥巴塑造任何东西一样。
塑造是指通过安排特定的强化相倚关系使有机体做出他们行为库中原先不曾有过的复杂动作。这种技术现在已引起人们极大的注意。例如,如果我们要训练鸽子走“8”型才给予强化,那需要等待很长时间。也许还没等它作出这种反应,早已饿死了。但如果我们采用塑造技术,就可以很容易达到目的。譬如:鸽子可能只是转一下头或朝顺时针方向迈出一步就给予强化。根据操作条件作用的原理,得到强化的反应很快就会重复。然后,只有当鸽子作出更为明确的按顺时针方向迈出一、两步时才给予强化,否则不给。然后三、四步四五步。最后,只对一个完整的顺时针转向动作才给予强化。随后开始只强化逆时针方向的反应,具体方法如上。当完整的逆时针转向“塑造”成功后,再恢复顺时针转向。最终,当鸽子能连贯转弯时才给予强化。于是整个行为反应很快就会重复。
用塑造的方法来解决人的行为问题。一个小孩生下来时就因患白内障而失明,在他尚未达到施行手术的年龄之前,他一直大发脾气。手术之后仍很难管理。让他戴上一副特制的眼镜,说如果不戴,将会永远失明,但他不听。他的这种行为时严重的自我诋毁行为。送到医院后被诊断为“儿童精神分裂症”。结果沃尔夫等人根据斯金纳操作条件作用的原理,设计一个强化相倚关系的程序,成功地塑造了戴眼镜的行为。当然,作为一个前提条件,是让这个儿童处于饥饿状态,以便使食物作为有效的强化物。首先将一副空的眼镜架放在桌上,只要出现任何与眼镜架接触的行为,就立即给予食物强化。强化可以按取眼镜架、把眼镜架放在身上等这样一些渐进的序列。当然,在塑造把眼镜架放在身上等这样一些渐进的序列。当然,在塑造把眼镜架准确地戴在脸上这一行为时还会遇到一些困难。当这一行为反应终于成功之后,再给眼睛架配上规定的镜片。最后这个小孩每天戴眼镜的小时数呈直线上升状态。
二、渐退:
渐退是指,通过有差别的强化,缓慢地减少两种刺激的特征,从而使有机体最终能对两种只有很小差异的刺激作出有辨别的反应。
斯金纳认为,通过巧妙地编排程序,可以使动物对微妙的刺进差别作出辨别反应。例如,可以通过渐退技术教鸽子“阅读”两个词:peck啄和ture转 。如前所述,用塑造的方法训练鸽子去啄由于鸽子对颜色视觉很敏感,只要通过几次尝试,鸽子就会学会只对大的黑体字作出反应。在鸽子学会这个反应后,开始逐渐消退这两种刺激的区别:大的黑体字越来越小;小的红体字越来越暗,直到最后这两个词都是 黑的,大小也一样。现在,鸽子能准确无误地辨别这两种刺激了,即学会“阅读”peck和ture了。
评价:
但是,西方有些学者认为,斯金纳的强化理论仅仅是桑代克学说的翻版,这未免言过其实了。斯金纳操作性条件作用原理的独特性,以及他所设计的技术在程序教学、课堂管理和行为矫正方面的有效性,使桑代克的效果所不能比拟的。