Ugrás a tartalomhoz

Általános pszichológia 1-3. – 2. Tanulás – emlékezés – tudás

Csépe Valéria, Győri Miklós, Ragó Anett

Osiris Kiadó

Instrumentális kondicionálás

Instrumentális kondicionálás

Az eddigiekben mindvégig azt elemeztük, hogy valamilyen diszkrét inger miként képes válaszkiváltásra, legyenek azok tanulási előzménnyel nem bíró ingerek (habi- tuáció, diszhabituáció, szenzitizáció) vagy előzetes tanulás, egészen pontosan klasz- szikus kondicionálás eredményeként egy másik ingerrel asszociatív kapcsolatban lévők. Ezekben az esetekben az ingert úgy követi valamilyen viselkedéses válasz, hogy az élőlénynek magára az eseményre semmiféle befolyása nincs. A klasszikus kondicionálás a tanulás alkalmazkodás típusú változata. A környezeti ingerekhez való alkalmazkodás három eltérő formája pedig a habituáció, a szenzitizáció és/vagy a klasszikus kondicionálás. Mindennapi környezetünkben számos olyan helyzettel találkozunk, amelyre nincs befolyásunk, azaz a tanulás elsődleges feladata az alkalmazkodás segítése. Számos olyan helyzet is van azonban, amelyben valamilyen történés az egyén viselkedésének direkt következménye, eredménye. Gondoljunk csak a legegyszerűbb példákra: tanulunk, megfelelően készülünk a vizsgára, jó jegyet kapunk. Ez a viselkedés ugyanakkor alapvetően eltér minden korábban tárgyalttól, hiszen ez az eszköze, instrumentuma egy adott esemény bekövetkezésének. Az ilyen tanulás során a válasz tehát azért jelenik meg, mert eszköze a következménynek, azaz instrumentális viselkedésről van szó. Mivel az instrumentális viselkedést azok az események alakítják, amelyeket ő maga létrehoz, célirányos viselkedésnek is nevezzük. Az instrumentális válasz azért jelenik meg, mert nélküle a cél nem lenne elérhető.

Hogyan tanulmányozható ez az instrumentális viselkedés a kísérleti pszichológia eszközeivel? Laboratóriumi körülmények között az instrumentális kondicionálás olyan paradigmáiban, amelyekben a paraméterek változtatásával ennek a tanulási formának az általános törvényszerűségei leírhatók. Az instrumentális helyzetben azonban nem valamilyen választ váltunk ki, hanem valamilyen viselkedés produkcióját, emisszióját próbáljuk elérni. Ebben a helyzetben ugyanis maga a válasz a változás ágense, azaz megelőzi a cél megjelenését. Ennélfogva kialakítása is nehezebb, hiszen a válasznak meg kell előznie a kellemes eseményt vagy jutalmat, illetve a később elkerülendő kellemetlenséget, büntetést.

Ha egy állatot vagy embert bármilyen új, kívánatos viselkedésre szeretnénk megtanítani, az instrumentális tanulás vezet célra. Skinner (1933, 1938) nem véletlenül szögezi le már első munkáiban, hogy az instrumentális válasz akaratlagos és emit- tált, nem pedig kiváltott.

E. L. Thorndike és az effektus törvénye

Az instrumentális kondicionálás laboratóriumi és elméleti munkái Edward L. Thorndike vizsgálataival kezdődtek még a 19. század végén (Thorndike, 1898, 1911). Darwin evolúciós elmélete ösztönözte Thorndike-ot arra, hogy feltárja, képesek-e az állatok is problémamegoldó gondolkodásra. Ehhez úgynevezett problémaketreceket (Thorndike-féle ketrec) konstruált, amelyekbe macskát, kutyát vagy csirkét helyezett el. A kialakítandó válasznak olyannak kellett lennie, hogy segítségével az állat kiszabadulhasson, s így megszerezze a ketrecen kívül elhelyezett táplálékot. Azt tanulmányozta, hogy maga a válaszadás miként függ össze annak későbbi konzekvenciáival. A kondicionálásnak ezt az alapformáját feltáró helyzetről a következő fejezetben ismét szó lesz, így itt csak röviden foglaljuk össze. A problémaketrecbe helyezett macska eleinte úgy igyekszik elérni az ételt, hogy mancsait a rácsokon kidugva kapkod utána. Ez azonban nem vezet eredményre, így explorál, és többféle viselkedéssel is próbálkozik, így érinti meg a kiszabadulást lehetővé tévő reteszt is. Ezt a viselkedéssort újra és újra lefuttatva egyre hatékonyabban jut a viselkedést megerősítő táplálékhoz. Az egymást követő próbák során a cél elérésében felesleges viselkedés csökken, elmarad, hatékony és gyors válasz alakul ki. Az ismételt próbák során megjelenő választ követi a cél, azaz a jutalomértékű táplálék elérése.

2.2. táblázat -

EDWARD LEE THORNDIKE (1874-1949)

Edward Lee Thorndike 1874-ben egy metodista lelkész fiaként született Lowellben, az amerikai Massachusetts államban. Tanulmányait a Wes- lyan Egyetemen kezdte, majd a Harvardon folytatta, ahol William James tanítványa volt. A pszichológia iránti érdeklődését James A pszichológia alapelvei című műve váltotta ki. Bár a Harvardon már csirkék útvesztőtanulását vizsgálta, de nem itt fejezte be tanulmányait. James Cattell meghívására a Columbia Egyetemen folytatta állatkísérleteit. 1898-ban megvédett doktori értekezésének címe az Állati intelligencia: az asszociatív folyamatok kísérleti vizsgálata állatokon volt. Ebben a munkájában fogalmazta meg először az effektus törvényét.

Thorndike 1899-től a Columbia Egyetem Tanári Karán pszichológiát oktatott, az emberi tanulás és oktatás alapelveit, valamint a mentális folyamatok vizsgálati lehetőségeit kutatta. 1912-ben Thorndike lett az Amerikai Pszichológiai Társaság elnöke, 1917-ben választották a Nemzeti Tudományos Akadémia tagjává. 1939-ben nyugdíjba vonult, de haláláig, 1949-ig aktív tudományos tevékenységet folytatott.


A naiv megfigyelőnek úgy tűnhet, hogy a macska tudatosan cselekszik, Thorndike azonban másként gondolkodott. Kísérleti eredményeinek értelmezésénél azt hangsúlyozta, hogy nincs egyetlen olyan pillanat sem, amikor úgy tűnne, hogy a macskának valamilyen belátása lenne, az adekvát viselkedés fokozatosan alakul ki a próbáksorán. A megfelelő válasz kialakulása egyfajta próba-szerencse viselkedés következménye, mégpedig annak eredményeként, hogy a jutalom közvetlenül követi a megfelelő választ. Az ilyen típusú próba-szerencse tanulással nem csak az állatoknál találkozhatunk. A tanulás folyamata jól szemléltethető a válaszidők próbánkénti ábrázolásával, az úgynevezett tanulási görbével.

Thorndike kísérleti munkáinak eredményeként fogalmazta meg az effektus törvényét. Az eredeti értelmezés szerint az állat új viselkedése úgy alakul ki, hogy adott szituációban a viselkedést kellemes élmény (pl. ételhez való hozzájutás) követi, így az állat saját viselkedését annak következményével asszociálja, a válasz megerősítést nyer. Ennek eredményeként később az eredetihez hasonló helyzetekben ezt az adott viselkedést viselkedésrepertoárjának más összetevőinél nagyobb valószínűséggel fogja produkálni. Ha egy adott helyzetben produkált viselkedést valamilyen kellemetlen esemény (pl. áramütés) követ, akkor az állat nem fogja megismételni ezt a viselkedést, az asszociáció gyengül.

Az instrumentális kondicionálás alapfogalmai

Az instrumentális kondicionálás tanulmányozásának ma is használt módszerei és a tanulás értelmezési keretei a 20. század első évtizedeiben alakultak ki. Két alapvetően eltérő technikát vezettek be: a diszkrét próbát és a szabad operáns eljárást. Thorn- dike kísérletei a diszkrét próba tipikus esetei. Ennek legfőbb jellemzője, hogy az állatot újra és újra a próbaketrecbe tesszük, azaz az instrumentális válasz mindig csak egyszer lehetséges. Ugyanilyen diszkrét próba a kondicionálási kísérletek legtöbbek által ismert helyzete, az útvesztő. A pszichológiatörténeti források szerint ezt az eszközt a tanulás kutatására elsőként W. S. Small használta az 1920-as években. Az eszköz igencsak jónak bizonyult, hiszen a futási időt és sebességet, valamint a válaszlatenciát a tanulási folyamat objektív mutatóiként tudták felhasználni.

A szabad operáns eljárás ma már klasszikus eszközét, a Skinner-dobozt vagy Skin- ner-boxot Burrhus F. Skinner alkotta meg. Skinner elsősorban az ingerek úgynevezett diszkriminatív funkcióit vizsgálta, túlnyomórészt patkányokon és galambokon. A tanulási folyamatok pontos tanulmányozására és a kísérletezés feltételeinek megfelelő helyzet kialakítására létrehozott, a mai napig használt (leggyakrabban gyógyszerhatást vizsgáló kísérletekben) kísérleti dobozát sokféle inger- és válaszadási eszközzel látta el. A klasszikus Skinner-doboz lehetővé teszi egy helyzetben több próba alkalmazását, illetve többféle művelet végrehajtását. Éppen ezért Skinner után az instrumentális tanulásnak ezt a formáját és helyzetét operáns kondicionálásnak nevezzük. Az operáns kifejezés azokra a válaszokra utal, amelyeknek bizonyos következménye van, a megerősítés pedig ezeket a konzekvenciákat jelöli.

A Skinner-doboz belseje alaphelyzetben teljesen csupasz, kivéve egy kiálló pedált, ami alatt egy etetőtál van. A pedál felett egy kis fény kapcsolható be, amelyet a kísérletvezető működtet. A patkány, miután egyedül hagyjuk a dobozban, körbejár, exp- lorál. Előfordul eközben, hogy néha megnyomja a pedált. Azt, hogy ez milyen gyakran történik, pedálnyomási gyakoriságnak nevezzük. Ennek alapszintje, azaz a kezdeti pedálnyomási gyakoriság a tanulási folyamat leírásánál fontos alapmutató, a szaknyelv ezt magazintréningnek nevezi. Az alapszint meghatározása után a kísérletvezető bekapcsolja az ételadagolót. Ettől kezdve, ahányszor a patkány közelít az etetőhöz, kis ételdarab hullik a tálba. Ez a kondicionálás formálás vagy shaping szakasza. A formálás két, egymást kiegészítő eljárásra épül: 1. a kívánt választ megközelítő, ahhoz hasonló válaszok megerősítése, 2. a korábbi, a kívánttól eltérő válaszoknál a megerősítés elmaradása.

2.3. táblázat -

BURRHUS FREDERIC SKINNER (1904–1990)

Burrhus Frederic Skinner 1904. március 20-án született az amerikai Pennsylvania állambeli kis városkában, Susquehanna-ban. BA-fokozatát a New York állambeli Hamilton College-ban szerezte angolból. Később beiratkozott a Harvard Egyetemre, ahol pszichológiát tanult. 1930-ban végzett pszichológusként, doktorátusát 1931-ben szerezte meg. Egészen 1936-ig a Harvardon kutatott, majd Minneapolisba költözött, a Minnesotai Egyetemen tanított. Felesége Yvonne Blue volt, két lányuk született. A kisebbik a pszichológiatörténeti írásokból jól ismert, ő az, akit csecsemőkorában egy úgynevezett „air crib"-ben, azaz egy üvegfalú, légkondicionálóval ellátott gyerekágyban-járókában neveltek.

Skinner 1948-ban tért vissza a Harvardra, itt dolgozott egészen élete végéig. Sokat publikált és sok könyvet is írt. Ezek közül leghíresebb a behaviorista szabályok alapján működő, képzelt társadalmat bemutató Walden II.

1990. augusztus 18-án halt meg leukémiában.


A formálási technika alkalmazásának egyik sokat emlegetett esete a reklámokhoz kötődik. Az ötvenes években két pszichológus televíziós műsorokhoz állatokat kondicionált, egyik híres állatuk volt „Priscilla, a finnyás malac”. Priscilla tévét nézett, a piszkos ruhát mosógépbe tette, porszívózott. Bár az akkori tévénézők Priscillát akár okos malacnak is tarthatták, a példa sokkal inkább a formálás egyik kirívó esete. A formálás módszerének egyik hasznos alkalmazása a vakvezető kutyák kiképzése.

Az operáns kondicionálás kezdeti szakaszában is formálás történik, majd a további tanulási szakaszban meghatározott választ kell produkálni. Például az ételért a patkánynak meghatározott számú pedálnyomást kell produkálnia; a próbák során a nyomkodás gyakorisága drámaian megnő. Ha a pedálnyomás nem eredményez ételt, akkor a gyakorisága csökken. Az instrumentális választ tehát a megerősítés hiánya éppen úgy kioltja, mint a klasszikus kondicionálásnál.

A Skinner-dobozban sokféle operáns kondicionálás, így diszkriminációs kísérlet is végezhető. Ennek az a lényege, hogy a patkány akkor és csak akkor kap ételt, ha az általában az etető felett elhelyezett lámpa meggyulladását követően, adott időn belül lenyomja a pedált. Ha a lámpa nem világít, akkor az állat pedálnyomás esetén sem jut hozzá ételhez. Egy idő után megtanulja, hogy a pedált csak akkor nyomja le, ha a lámpa világít. Ebben az elrendezésben a fény jelzi a pedál lenyomásának következményét, a fény úgynevezett diszkriminációs ingerként szolgál, valójában ugyanúgy jelzőinger, azaz a tanulás hatására kialakult feltételes inger: CS. Ennek a differenciális válaszadásnak a kifejlődését nevezzük diszkriminatív tanulásnak. A CS-re adott válasz, azaz operáns művelet egy feltételes válasz, tehát CR, ennek kialakulását és fenntartást biztosítja az őt követő megerősítő. A létrejött kapcsolat inger-válasz, azaz S-R típusú, a válaszerősséget maga a válaszgyakoriság mutatja. Minél gyakoribb a válasz, annál nagyobb a válasz erőssége.

A diszkrimináció azonban különböző komplexitású lehet. Van olyan diszkriminációs helyzet, amelyben az alanynak a pedált attól függően kell megnyomnia, hogy egy bizonyos inger jelen van-e vagy sem (szukcesszív vagy go/no go diszkrimináció). Egy másik kísérleti elrendezésben kettő vagy több inger van jelen, és mindegyikhez más válasz kapcsolódik. Az ilyen helyzetben, amellyel például Lashley is igen sokat kísérletezett, az úgynevezett szimultán diszkrimináció alakítható ki. Az eddig bemutatott kísérletekben azonban a megerősítő hatékonysága nem mindig egyforma, ezt az állat aktuális állapota is erősen befolyásolja (pl. egy szomjazó állat esetén a víz hatékonyabb megerősítőnek bizonyul).

Instrumentális kondicionálási eljárások

Minden instrumentális kondicionálási helyzetben a válasz valamilyen következménynyel jár. Az instrumentális kondicionálási eljárások aszerint osztályozhatók, hogy milyen annak a környezeti eseménynek a természete, amelyet az adott válasszal kontrollálunk. Az adott esemény lehet kellemes vagy kellemetlen. A kellemest ap- petitív, a kellemetlent averzív ingernek nevezzük. További fontos eleme az instrumentális tanulási folyamatok osztályozásának a válasz és a környezeti esemény, inger viszonya vagy kontingenciája. Az instrumentális válasz létrehozhat, előidézhet vagy éppen megszüntethet, elkerülhet valamilyen eseményt. Az előbbit pozitív, az utóbbit negatív kontingenciának nevezzük Az előbbiekből négy alapvető instrumentális kondicionálási eljárás következik. Ezt az 1.1. táblázat mutatja be.

2.4. táblázat - 1.1. táblázat. Instrumentális kondicionálási eljárások

Az eljárás neve

Az operáns válasz hatása

Pozitív megerősítés

A válasz olyan appetitív inger megjelenéséhez vezet, amelynek megjelenési valószínűsége a válasz hiányában kicsi.

Büntetés

A válasz olyan averzív inger megjelenéséhez vezet, amelynek megjelenési valószínűsége a válasz hiányában kicsi.

Negatív megerősítés (menekülés és elkerülés)

A válasz megszüntet vagy megelőz, megakadályoz egy olyan averzív ingert, amelynek megjelenése a válasz nélkül valószínű.

Omissziós (kihagyási) tréning

A válasz megszüntet vagy megelőz, esetleg megakadályoz egy olyan appetitív ingert, amelynek megjelenése a válasz nélkül valószínű.


Vegyük a továbbiakban sorra ezeket az eljárásokat, illetve tényezőket. Kezdjük elsőként a megerősítéssel. Megerősítőnek nevezünk minden olyan ingert, eseményt, amelynek hatására adott válasz megjelenési gyakorisága nő. A megerősítő ágensek lehetnek pozitívak és negatívak. A megerősítő minősége tehát lehet pozitív vagy negatív, a válaszra vonatkozó hatásuk azonban ugyanaz, a megerősített válasz gyakorisága nő.

Pozitív megerősítés

A pozitív megerősítés olyan helyzet megjelölésére szolgál, amelyben pozitív kon- tingencia van az operáns válasz és az appetitív megerősítő inger között. Másként megfogalmazva, amennyiben a kísérleti alany a megfelelő operáns választ produkálja, kellemes, kívánatos inger, esemény jelenik meg, a válasz hiányában pedig ez elmarad. A megerősítés hatására az operáns válasz gyakorisága nő, a válasszal a kellemes esemény valószínűsége növekszik (étel, víz, szexuális kontaktus lehetősége). A mindennapi életben számos ilyen példát látunk. A kisgyermek elrakja a játékait, a szülő pedig megjutalmazza (édesség, dicséret), a jó munkavégzés prémiummal jár. Gyakori, hogy a pozitív megerősítési eljárásban folyamatos jutalmazás történik. Ez azt jelenti, hogy mindaddig, amíg a megfelelő operáns válasz megjelenik, a jutalom is bekövetkezik, vagy éppen nő.

A pozitív megerősítő sokféle lehet. Az ilyen megerősítésnek egyik nagy figyelmet kiváltó esete volt C. K. Rovee és D. T. Rovee (1969) klasszikus kísérlete, amelyben csecsemőket kondicionáltak egy az ágyuk fölé függesztett mobiljáték használatával. Ahányszor a babák lábukkal rugdosni kezdtek, a mobil megmozdult. Minél erősebben rugdostak, annál erősebben mozgott. A rugdosási válasz igen gyors kiépülése az operáns válasz és a környezet mechanikus kapcsolatának egyik jellegzetes példája. Ez a helyzet egyébként gyakori példája az ingerkontroll-elméleteknek (Gillette- Martin-Balingham, 1980, lásd később).

Büntetés és negatív megerősítés

A büntetés fogalmának megértéséhez el kell vonatkoztatnunk a szó köznapi értelmétől. A büntetéses kondicionálás során pozitív kontingencia jön létre az operáns válasz és egy kellemetlen vagy averzív inger között. Ha a kísérleti személy adott választ produkál, az averzív inger megjelenik, ha nem, a kellemetlen inger elmarad. A mindennapi életben sok ilyen példát láthatunk. Szemrehányást kapunk, ha elkésünk, rossz jegyet kapunk, ha a vizsgakérdésekre sok rossz választ adunk. A büntetésalapú kondicionálási eljárás az operáns válasz megjelenésének valószínűségét csökkenti. Nem keverendő össze a büntetés a negatív megerősítéssel csupán azért, mert az alkalmazott megerősítő averzív. A pozitív megerősítés és a büntetés is pozitív kon- tingenciára épül, azaz, ha van válasz, van megerősítés, ha nincs válasz, elmarad a megerősítés. A különbség annyi, hogy az első esetben a megerősítő pozitív, a másodikban pedig negatív. A büntetés esetében tehát a negatív megerősítő elmaradásához az operáns válasz elmaradása szükséges.

A negatív megerősítés során a megerősítő maga is negatív, azaz kellemetlen, esetleg fájdalmas inger. A jelzőingerre adott feltételes válasz a megerősítés hatására egyre gyakoribb, sikeresebb lesz, a kellemetlen hatás elmarad, azaz az inger-válasz kapcsolatban negatív kontingencia hat. A negatív megerősítésnek két formája van. Az egyik helyzetben az averzív inger mindig jelen van, azonban a megfelelő válasszal hatása megszüntethető, befejezhető. Ez az úgynevezett menekülő instrumentális tanulás. Ilyen hétköznapi példa lehet, hogy a nem kedvelt tévécsatornáról, rádióállomásról továbbkapcsolunk, otthagyjuk a nem tetsző mozielőadást. Ehhez hasonló az állatkísérletes helyzet is. Patkányoknak erős, kellemetlen hangot adunk, ez azonban kikapcsolható egy pedál lenyomásával vagy egy pódiumra történő felugrással. A választ a kellemetlen hang megszűnése erősíti meg.

A negatív megerősítés másik esete az elkerülő instrumentális tanulás. Ebben a helyzetben az averzív inger megjelenése várható, ennek bekövetkezése azonban a megfelelő válasszal elkerülhető. Ilyen hétköznapi helyzet, ha a tűzriadó hallatán elhagyjuk az épületet, elkerülendő egy lehetséges sérülést, vagy újabb és újabb riasztóberendezést szereltetünk az autónkba, hogy elkerüljük annak feltörését, ellopását. Ilyen állatkísérletes helyzet az adott szignált követő áramütés, amelynek bekapcsolását megfelelő válasszal az állat elkerülheti.

Omissziós tréning

Ugyancsak a válasz és a megerősítő negatív kontingenciájára épül az omissziós tréning. Ebben az esetben a válasz a kellemes esemény, az appetitív megerősítő elmaradását eredményezi. A válasz-megerősítő kapcsolat lényege, hogy a válasz megjelenésekor nincs megerősítő, a válasz elmaradásakor pedig van. Az omissziós téning a humán tanulásban gyakran használt eljárás egy adott viselkedésről való leszokta- tásban, hiszen itt nincs negatív megerősítő, mint például a büntetés esetében. Hétköznapi példája ennek, amikor a rosszalkodó kisgyermeket a szülők a szobájába küldik. A gyermek szobája nem averzív, nem is ez a megerősítő, hanem a kellemes esemény, közös játék, társaság, tévénézés megvonása. Az omissziós tréning egy másik gyakran használt neve a más viselkedés differenciális megerősítése. A kifejezés arra utal, hogy az omissziós tréningben más, a tréningben specifikálttól eltérő viselkedést kívánunk megerősíteni.

A megerősítők természete

Eddig említett példáinkban többnyire olyan megerősítőkre (étel, víz, menekülés egy veszélyes helyzetből) hivatkoztunk, amelyek az alapvető szükségletek körébe tartoznak. Ezért ezeket elsődleges megerősítőknek nevezzük. Az operáns kondicionálás azonban nem csupán elsődleges megerősítőkkel működik. Ezt azért is fontos figyelembe vennünk, mivel az operáns kondicionálás a tanulásnak egy olyan igen gazdag és elterjedt formája, amelyben az elsődleges megerősítők nem túl gyakoriak. A tanulást tehát sok esetben másfajta megerősítők közvetítik, mediálják. Szinte minden inger másodlagos, azaz kondicionált megerősítővé válhat, mégpedig úgy, hogy eredetileg elsődleges megerősítőkkel kerül társításra. A másodlagos megerősítők megjelenésével az operáns kondicionálás hatóköre jelentősen megnő, hasonlóan ahhoz, ahogy azt a klasszikus kondicionálásnál a másodlagos kondicionálással kapcsolatban láttuk.

A másodlagos megerősítés szokványos kísérleti helyzetében a patkány pedálnyomását hang, majd étel követi. Az étel mint elsődleges megerősítő hatására a hang másodlagos megerősítő tulajdonságokra tesz szert. Ezt követően kerül sor a kioltásra, azaz a pedálnyomást nem követi étel. Amennyiben azonban a pedálnyomással a hang kiváltható, annak ellenére, hogy az ételadagoló nem működik, a pedálnyomás gyakorisága az előzetes kioltás és az elsődleges megerősítő elmaradásának ellenére megnő. A hang tehát saját megerősítő tulajdonsággal bír ebben a helyzetben. A másodlagos megerősítő tulajdonság a klasszikus kondicionálás szabályai szerint alakul ki: a hang (CS) az étellel (UCS) következetes idői egybeesést mutat, így annak jelzésévé válik. Az ember társas környezete bővelkedik másodlagos megerősítőkben. Ilyen például a pénz, a dicséret, az iskolai osztályzat (a humán megerősítők rendszeréről a későbbi fejezetekben még bőven lesz szó). A megerősítőket azonban nem csupán aszerint különítjük el, hogy kapcsolódnak-e elsődleges szükségletek kielégítéséhez vagy sem, hanem aszerint is, hogy milyen a válaszhoz való viszonyuk.

Válasz-megerősítés viszony

A megerősítők lehetnek belső, természetes és külső, mesterséges viszonyban a válasszal. Intrinsic megerősítőről akkor beszélünk, ha a megerősítőnek természetes a válaszhoz való kapcsolata (pl. egy zenész a zene élvezete miatt játszik). Az extrinsic megerősítőnek viszont mesterséges a válasszal való kapcsolata (pl. egy zenész a pénzért játszik).

A megerősítő azonban nem csupán valamilyen állapot létrehozásával lehet kapcsolatos, hiszen a környezetnek szenzoros vagy más minőségei is megerősítőként hatnak. A szenzoros megerősítők hatását illusztrálja az a kísérlet, amelynek során a sötétben lévő patkánynak egy pedál állt a rendelkezésére. A patkány a pedál megnyomásával fényt tudott bekapcsolni, így a pedálnyomás gyakorisága megnőtt. Ebben a kísérletben tehát a fény megerősítőként szolgál. A jelenség alapja az állat explorá- ciós motivációja, kíváncsisága. Bár a motivációról a pszichológiai tanulmányok külön kurzusában esik bővebben szó, érdemes már itt megjegyeznünk, hogy adott állapot fenntartása ugyancsak megerősítőként működik. Nem csupán az ingerkeresés és a kíváncsiság ilyen, hanem a társak keresése is. Ennek kísérleti példája az a helyzet, amelyben majmok egy kapcsoló megnyomásával egy ajtót nyithattak ki. Ha a nyitott ajtón keresztül láthatták társaikat, megnőtt a kapcsolónyomkodás gyakorisága. A megerősítés alapja az állat szociális, kommunikációs szükséglete. Erről a szociális tanulással foglalkozó fejezetben még szó lesz.

Bár természetesnek tűnhet a megerősítést ingerként felfogni, néha hasznosabb, ha a megerősítést valamilyen tevékenységként fogjuk fel. A pedálnyomást például nem maga az étel, azaz nem annak látványa, hanem elfogyasztása erősíti meg. Embernél az erősebb késztetés akár elsődleges megerősítőket is „legyőzhet”. A tanulás azonban igen komplex, hiszen az egyén preferenciái meghatározóak. Egy kísérletben például gyerekek játék és édesség között választhattak. Azok a gyerekek, akik az édességet preferálták, gyakrabban játszottak, ha ezért édességet kaptak; az édesség működött megerősítőként. A játékot előnyben részesítő gyerekek viszont fordítva viselkedtek: több édességet ettek, ha ezzel a játék esélyét növelhették. Ez a jelenség ugyancsak továbbmutat a humán tanulással foglalkozó későbbi fejezetekhez.

Amint említettük, az operáns/instrumentális kondicionálás során a tanulást következményei hozzák létre, és azok is kontrollálják. Sok esetben nyilvánvaló a válasz és a következmény kapcsolata, jóllehet ez nem mindig van így. Gyakori, hogy a válasz és a következmény viszonya látszólagos. Az élőlény szempontjából tehát a viselkedés és konzekvenciája közötti kapcsolat episztemológiai probléma. Tegyük fel, hogy egy nehéz vizsgára felvesszük az új piros pulóverünket, a vizsga pedig sikerül. Nyilvánvaló, hogy a két dolognak nincs semmi köze egymáshoz. Az idői kontiguitás azonban erős kapcsolatképző faktor, azaz két független esemény is instrumentális kapcsolatba kerülhet, adott viselkedés (piros pulóver) megerősítője a jó vizsgajegy. E babonás viselkedés állatkísérletes modelljét Skinner dolgozta ki.

Skinner „babonás viselkedés" kísérlete

Skinner eredetileg azt vizsgálta, hogy lehetséges-e instrumentális tanulás a válasz és megerősítő pozitív kontingenciája nélkül is. A galambokat különböző ketrecekbe helyezte, és az etetőjükbe 15 másodpercenként magot juttatott, mégpedig függetlenül attól, hogy a galambok éppen mit csináltak. A szokásos kondicionálási helyzettől eltérően a galamboknak nem kellett egy válaszgombot csipegetni vagy bármilyen más választ produkálni ahhoz, hogy táplálékot kapjanak. Skinner a következő megfigyelését írta le:

„Nyolc esetből hatban az állatok viselkedése oly egyértelmű volt, hogy két független megfigyelő értékelése tökéletesen egyezett. Az egyik madár az óramutató járásával ellentétes irányban kétszer körbefordult a ketrecben, két megerősítő között két vagy három fordulatot téve. Egy másik ismételten a ketrec egyik sarkához dörgölte a fejét a megerősítést megelőzően. Egy harmadik »fejemelő« választ alakított ki, olyat, mintha fejét egy láthatatlan rúd alá tenné, és azt ismételten megemelné.” (Skinner, 1948, 168. o.)

Mivel a megerősítő megjelenése mindenféle viselkedéstől független volt, Skinner a galambok megfigyelt viselkedését a babonás viselkedéssel azonosította. Magyarázata szerint ennek kialakulásában a véletlen megerősítés játszik szerepet.

Skinner magyarázatának lényege: a válaszmegerősítés a kontiguitás, azaz az idői egybeesés, és nem a kontingencia. Később azonban Staddon és Simmelhag (1971) megismételte Skinner kísérletét, ám minden viselkedést folyamatosan követtek és regisztráltak: a madarak csipkedő, szárnycsattogtató, orientációs és explorációs válaszait. Mérték mindegyik válasz gyakoriságát a megerősítések között. Végül azt találták, hogy az ételadó szerkezetre adott orientáció és az ahhoz közeli területek csipkedése volt a két megerősítés közötti leggyakoribb válasz. Ezt a szerzők terminális válasznak nevezték. A megerősítéseket másfajta válasz követte leginkább, ilyen volt az etető körüli mozgás, forgás. Ezeket nevezték köztes vagy interim válasznak. Sikerült tehát kimutatni, hogy a megerősítő periodikus megjelenése bizonyos fajta, a fajra jellemző reguláris válaszok gyakoriságát növeli. Mi lehet az oka a terminális és az interim válaszok eltérő megjelenésének? Staddon és Simmelhag felfogása szerint a terminális válasz fajspecifikus anticipációs válasz, az interim pedig az általánosabb motivációs állapot megnyilvánulása. Mások szerint mindkettő ugyanannak a motivációs állapotnak, illetve az állat viselkedésrendszeréhez tartozó elemeknek a helyzetfüggő megnyilvánulása (Timberlake-Lucas, 1985).

Megerősítési tervek

A valódi életben ritka, hogy egy adott viselkedést mindig megerősítés kövessen. Így aztán nehezen lenne magyarázható az operáns kondicionálással kialakuló tanulás minden esete, ha csak a folyamatos megerősítéssel (kontinuitás) működne. Mindennapi tapasztalataink is azt mutatják, hogy egy viselkedés kialakítható és fenntartható akkor is, ha nem kap állandó megerősítést. Minden ilyen megerősített esetet részleges megerősítésnek nevezünk. A jelenség egy olyan laboratóriumi galamb példájával (Skinner egyik kísérlete) szemléltethető, amely részleges megerősítési mintázat szerint adott táplálékjutalomért megtanulta, hogy egy gombot csipkedjen. A válasz akkor is fennmaradt, ha csak ritkán kapott megerősítést, sőt a részleges megerősítéssel tanult válasz kioltása is sokkal lassabb volt, mint a folyamatos megerősítéssel tanult válaszé. Ezt a kioltással szembeni ellenállást nevezzük részleges megerősítési hatásnak. A hatás viszonylag egyszerűen magyarázható: kisebb a különbség a tanulási és kioltási szakasz között, ha a tanulás során a válasz megerősítése részleges.

Amikor nem folyamatos válaszmegerősítési eljárást alkalmazunk, azt is tudnunk kell, hogy milyen gyakorisági, illetve idői jellemzők szerint követi a választ a meg

erősítő. Az operáns kondicionálás során a tanulás és kioltás egyik jellemző faktora a válaszok és a megerősítők viszonya, azaz a megerősítési terv. A megerősítési terv típusa erősen befolyásolja a válaszok mintázatát, illetve a válasz kioltással szembeni ellenállását. A megerősítési tervnek a tanulásra gyakorolt hatását szemlélteti az 1.6. ábra. A megerősítési tervek két dimenzió mentén különbözhetnek, ezek az adott és a megerősített válaszok aránya, illetve a megerősítések között eltelt idő.

Aránytervek

Az aránytervek esetében a megerősítések és az élőlény által adott válaszok számának egymáshoz viszonyított arányát változtatjuk. Az arány lehet rögzített és lehet változó. Rögzített arányú megerősítési terv (RA) esetén a megerősítésért elvárt válaszok számát egy bizonyos értéken rögzítjük. Például kondicionálhatunk úgy, hogy minden ötödik (RA 5) vagy minden tizedik (RA 10) választ erősítünk meg. A válaszok száma az aránnyal egyenes összefüggést mutat: minél magasabb az arány, annál nagyobb gyakorisággal válaszol az állat. Ez különösen így van akkor, ha kezdetben alacsony értékkel (pl. RA 5) tanítjuk az állatot, majd a megerősítési arányt egyre magasabbra emeljük (pl. RA 50). A rögzített arányú megerősítési terv alkalmazásakor azonban azt tapasztalhatjuk, hogy közvetlenül a megerősítést követően hosszabb-rö- videbb válaszszünet vagy megerősítés utáni szünet van.

Változó arányú (VA) megerősítési terv esetén is egy bizonyos számú válasz után jár csak megerősítés, de ez a szám egy adott tartományban bejósolhatatlanul változik. A VA 5 terv alkalmazása esetén például a megerősítéshez szükséges válaszok száma néha egy, néha tíz, de átlagban öt. A VA terv szerinti megerősítéssel tanuló állat nem tart szüneteket, ez pedig nagyon magas válaszgyakoriságot eredményez.

1.6. ábra. Az instrumentális kondicionálás során használt megerősítési tervek sematikus válaszdiagramja

A VA terv hétköznapi példái a nyerőautomaták. A megerősítéshez (nyeréshez) szükséges válaszok (játszmák) száma itt állandóan változik, a játékosnak nincs módja kitalálni, hogy mikor várható nyeremény, válasza azonban hosszan fennmarad, a megerősítések hosszú ideig tartó elmaradásakor is ellenáll a kioltásnak.

Idői vagy intervallumtervek

A megerősítési tervek másik nagy csoportját az idői vagy intervallumtervek alkotják. Ezek esetében a megerősítések között eltelt időt (percben mérve) szabályozzuk, és nem a válaszok számát. A megerősítés csak bizonyos idő elteltével következik be, ez pedig lehet rögzített vagy változó. A rögzített intervallumot (RI) használó tervek esetében az állat azt a válaszát követően kap újabb megerősítést, amelynek megjelenéséig az előző megerősített választól számítva egy bizonyos idő telt el. Az RI 2 terv esetében csak akkor van megerősítés, ha két perc telt el az előző megerősített válasz óta; a közbülső két percbe eső válaszokat nem erősítjük meg. Az RI terv alatti viselkedést is a megerősítés utáni válaszszünet jellemzi, a válaszgyakoriság pedig nő az idő lejártának közeledtével. Az RI terv hétköznapi példája a mosógép. Minden fázisnak meghatározott ideje van. Hiába nyitjuk ki a mosógépet ennek lejárta előtt, nem számolhatunk azzal, hogy kész a program, és kivehetjük a tiszta ruhát.

2.5. táblázat -

GYENGÉINK ES AZ INSTRUMENTÁLIS KONDICIONÁLÁS: PÉNZ, SIKER, SZERENCSE

Az emberi viselkedésformák nagyon összetettek, így általában nehéz olyan tanulási formákat találni, amelyekben csak az egyik vagy csak a másik alapvető tanulási forma a meghatározó. Az instrumentális tanulással kapcsolatban azonban szó volt arról, hogy vannak olyan másodlagos megerősítők, amelyek legalábbis a kialakuláskor jól köthetők a primer megerősítőkhöz. A másodlagos megerősítők egy része pontosan a primer megerősítőkhöz való kiterjedt és komplex kapcsolódása miatt a többieknél erősebb lehet. A humán motivációk hierarchiájában azonban ezeknek a megerősítőknek a kapcsolata nem csupán összetett, hanem jellegzetes is; sok más faktorral kölcsönhatásban jelennek meg, és nagy egyéni variációkat mutatnak. Példaként felhozható a pénz és az ahhoz való viszonyunk.

A pénz már a föníciaiak óta a legelterjedtebben használt általános megerősítő, és mint ilyen, többféle tulajdonsága befolyásolja az emberi viselkedést, így többek között a munkateljesítményt is. Ez utóbbit ugyan több tényező befolyásolja, így a motivációs rendszer hierarchiája is, itt most csak egy aspektusát emeljük ki, ez pedig a teljesítményt befolyásoló megerősítési terv. A megerősítési tervek tárgyalásánál láthattuk, hogy a megerősítési aránytervek azok, amelyek a legerőteljesebben hatnak a válaszhajlandóságra. Ez az emberi teljesítmény esetében is így működik, bármennyire komplex is a motivációs rendszerünk.

Egy amerikai családi étterem például felszolgálóinak teljesítményét javítandó, pszichológusok tanácsára egy új bérezési eljárást vezetett be (George-Hopkins, 1989). A kondicionálás nyelvére lefordítva: rögzített arányú megerősítési tervet vezettek be, azaz a megerősítés (pénz) összege a válaszadástól (ellátott vendégek és bevétel) függött, azaz a forgalom arányában, összegszerűen pedig progresszíven változott a felszolgálók bérezése. Ezt a ma érdekeltségalapú teljesítménybérezésnek nevezett rendszert a jól működő szolgáltatók szerte a világban elterjedten használják. Ne feledjük azonban, hogy az emberi megerősítők rendszere nem egyszerűsíthető le csak a pénzre. Nem véletlen, hogy a foglalkozások piaci értéke mellett mennyi más kiegyenlítő tényező hat, melyek az alacsonyan fizetett szakmákban is ott tarthatják azok művelőit.

A rögzített arányú megerősítési terveknél azonban az állatkísérletekben a jutalmat általában válaszadási szünet követi. Ezzel az emberi viselkedésben is találkozhatunk, ennek tipikus példája, hogy a hallgatók a zárthelyi dolgozatok előtt sokat tanulnak, azt követően viszont nem. A válaszadás fenntartására, azaz az állandó készülés kikényszerítésére sokan használnak változó arányt, azaz nem rögzített időpontokat, ezt azonban az érintettek elég rosszul tűrik. De térjünk vissza arra, hogy miért modulálja annyi minden az említett általános megerősítő, a pénz hatását. Az okok az emberi motivációs rendszerben és a személyiségben keresendők. Ezek közül itt most egyet emelünk ki, a dicséret és a siker megerősítő hatását. Ennek kialakulása megfelelő szocializáció mellett már a gyermekkorban megjelenik (a szociális tanulásról szóló fejezetben szó lesz még erről), a dicsérő szó, a közösség elismerésében mérhető siker lényeges incentív tulajdonságokra tesz szert. A siker más jegyeiről itt most nem beszélünk, arra viszont lezárásként még röviden kitérünk, hogy a pénz és a változó arányú megerősítésre erősen épülő szerencse és szerencsehit miként képes megváltoztatni viselkedésünket.

A változó megerősítési arány leggyakrabban emlegetett példái a szerencsejátékok. Még a legbutább szerencseautomaták (régi mechanikus szerkezetük miatt félkarú rablónak is hívott szerkezetek) is a változó arányú megerősítés algoritmusát alkalmazzák, fenntartva ezzel a magas válaszhajlandóságot és ellenállva a kioltásnak. Újabb és újabb érméket dob be a játékos, és hosszú jutalomelmaradás után sem hagyja abba. Legalábbis amíg van pénze. A pénzben játszott kártyajátékok is ilyenek, hiszen az események valószínűségéről a megrögzött játékosnak szubjektív, a megerősítés várható bekövetkezését túlértékelő viselkedése alakul ki. Ez tartja fenn többek között a választ. Ez a forgatókönyv azonban a kellemes izgalmakhoz vezető incentív motivációkat felerősíti, nem véletlen, hogy a nagy veszteségek nem működnek ellenkondicionálásként.


A megerősítés a változó intervallumot (VI) használó terveknél is adott idő elteltéhez kötött, ez az időtartam azonban egy adott tartományon belül bejósolhatatlanul változik. A VI 10 perces terv esetén például ez az időtartam néha két perc, néha húsz, de átlagosan tíz perc. A VI terv alkalmazása egyenletesen magas válaszgyakoriságot eredményez. A VI terv mindennapi példája az autójavítás, amikor is lehet tudni, hogy körülbelül milyen időintervallumon belül készül el az autó, de az elkészülés pontos ideje mégsem tudható.

A megerősítés kontrollja

A mobiljáték mozgását rugdalódzással kontrolláló csecsemők eseténél már utaltunk arra, hogy az instrumentális kondicionálás egyik fontos eleme a válasz és a megerősítés összefüggése – vagy más néven a kontroll. Az averzív ingerek feletti kontroll úttörő munkái a Seligman-csoport nevéhez fűződnek. A tanult tehetetlenség kidolgozott modelljét Martin Seligman (1975) publikálta saját, kutyákkal végzett averzív kondicionálási kísérleteinek eredményeire alapozva. Seligman abból a megfigyelésből indult ki, hogy a kutyák nagyon gyorsan meg tudják tanulni, hogy miként kerülhetik el az áramütést, ha azt a fény előre jelzi. Seligman azonban nem ezt a helyzetet alkalmazta. A kutyákat először olyan kísérleti ketrecbe helyezte, amelyben időnként áramütést kaptak, de ezt, bármit is csináltak, sehogyan sem tudták elkerülni. Ezután ugyanezeket a kutyákat átrakta egy olyan ketrecbe, amelyben az áramütést a fény előre jelezte, a kutyák pedig megfelelő elkerülő válasz megtanulásával el tudták volna kerülni az áramütést. Az előzetesen klasszikus kondicionálási helyzetben tanuló kutyák azonban ezt a választ nem tudták megtanulni, ehelyett először körbeszaladtak a ketrecben, majd lefeküdtek és szűköltek. Néhány kutya sohasem tanulta meg ezt a választ, még akkor sem, ha a kísérletvezető bemutatta a helyes eljárást úgy, hogy átemelte a kutyát a fal fölött.

A kutatók arra a következtetésre jutottak, hogy az állatok a korábbi kondicionálással azt tanulták meg, hogy az áramütést nem lehet elkerülni, így az új helyzetben az elkerülő tanulás nem jött létre. Seligman ezt a jelenséget nevezte el tanult tehetetlenségnek. Maga a helyzet azonban nem kizárólagosan a kontrollról szól. Itt sokkal inkább a klasszikus és instrumentális kondicionálás interakciójáról van szó. Erre később még visszatérünk. Itt még azt érdemes megjegyeznünk, hogy Seligman eredeti „tanult tehetetlenség” modellje csak adott feltételek mellett érvényes. Az eredeti 1975-ös modellt módosítani kellett ahhoz, hogy meg lehessen magyarázni azt az emberekre jellemző eltérést, amely abban áll, hogy míg egyesek a befolyásolhatatlan események hatására tehetetlenné válnak, mások számára ugyanezen helyzetek kihívást jelentenek. A Seligman-féle elmélet érvényesülésének a személyiségben keresendő feltételrendszerét a személyiségpszichológiai kurzusok tárgyalják, itt bővebben nem foglalkozunk vele.

A megerősítés elméletei

Hagyományosan a megerősítés az operáns/instrumentális tanulás egy mediáló faktora, egy olyan inger, amely megerősíti a választ. A jelenséget magyarázó elméletek abban különböznek egymástól, hogy milyen folyamatokra vezetik vissza e megerősítő hatását. Ezek közül az elméletek közül itt most a legfontosabbakat mutatjuk be.

Megerősítés: ingerbemutatás

A legtöbb instrumentális tanulási helyzetben olyan biológiailag fontos ingerek a megerősítők, mint a táplálék vagy a víz. A kondicionálást táplálék- vagy vízmegvonás előzi meg, ezt követően kerül sor ezek megerősítőként történő alkalmazására. Mivel ezek az ingerek életfontosságúak az állat számára, több elméletalkotó a megerősítők fiziológiai aspektusait hangsúlyozta. Ezek közül az egyik legismertebb Clark Hull elmélete, amely a deprivációt az élőlény két ellentétes fiziológiai állapotának tekintette. A fiziológiai homeosztázis koncepciójának lényege, hogy az organizmus igyekszik fiziológiai rendszereit megfelelő egyensúlyi helyzetben tartani. A depriváció ezt az egyensúlyt borítja fel, a megerősítés viszont ebbe az állapotba juttatja vissza. Az instrumentális válasz motivációja tehát nem más, mint a rendszernek a depriváció által a homeosztázisból kibillentett állapotának helyreállítása. E koncepció értelmében a megerősítés azért működik, mert az élőlény ezt a homeosztatikus állapotot igyekszik visszaállítani. Hull elképzelése szerint a kondicionálást megelőző állapot hajtóerőként, azaz drive-ként működik. A megerősítő ezt a drive-ot csökkenti, azaz a megerősítés lényege a drive-redukció.

A drive-redukciós elmélet értelmében a megerősítés minden egyes alkalommal közelebb juttatja az élőlényt a homeosztázis állapotához. Az organizmusnak az a veleszületett hajlama, hogy igyekezzék a homeosztázis állapotába kerülni, a válasz motivációs alapja. Hull ezért úgy vélte, hogy a drive erőssége meghatározza a válaszkészség fokát. A fiziológiai szükséglet vagy drive a környezet olyan elemeihez kapcsolódik, amelyek az egyed túlélése szempontjából fontosak. Ezért az étel, a víz és a megfelelő hőmérséklet sikeresen használható megerősítők.

A drive-redukció elmélete szerint a megerősítés a szélesebb értelemben vett motivációs rendszer része. A megerősítés tehát kikényszeríti a viselkedés változását. Honnan ered a megerősítésnek ez az ereje? Gyakran az organizmus drive-állapotából. A drive-állapot által indukált motivációt nevezzük elsődleges motivációnak. A viselkedés motivációja azonban magából a megerősítő ágensből is következhet, hiszen a táplálék, a víz vagy a szexuális partner jelenléte a viselkedés kiváltója lehet. A megerősítő által kiváltott motivációt – a már korábban említett példához hasonlóan – in- centív motivációnak nevezzük. A motivációnak kétféle forrása lehet: 1. a drive-állapot és 2. a megerősítő incentív tulajdonságai, azaz a drive-indukció. A pszichológiában éveken át folyt a redukció kontra indukció vita. Mára összefoglalóan megállapíthatjuk, hogy a megerősítés nem tekinthető kizárólagosan sem indukciónak, sem redukciónak.

Megállapítható tehát, hogy a drive-redukció nem elegendő a megerősítő hatás magyarázatára. A külső ingereknek ugyancsak fontos szerepük van az instrumentális válasz kialakításában. A drive-redukciónak a megerősítésben játszott kizárólagos szerepe ellen szólnak azok a kísérleti eredmények, amelyek azt mutatják, hogy biológiailag vagy fiziológialag jelentősnek nem tekinthető tényezők is megerősítőként működhetnek. A megerősítéselméletek egyik prominens képviselője, Berlyne szerint például „megfelelő körülmények között bármi működhet jutalomként” (Berlyne, 1969, 182. o.). Majmoknál a mozgó kisvonat látványa megerősítőként használható, az explorációt lehetővé tevő fény bekapcsolása, az édes víz nyalogatása mind megerősítőként használható, jóllehet ezek egyike sem csökkent valamiféle fiziológiai szükségletet. Az ingerek szenzoros jutalomértéke az embernél még kifejezettebb. A művészi alkotások, a zene, a tánc, az előadó-művészetek szenzoros megerősítőként működnek. Ezekre a drive-redukciós hipotézis logikai zsákutca nélkül nem alkalmazható.

Az agyi ingerléssel végzett kísérletek eredményei sem sugallnak mást, mint azt, hogy a megerősítés drive-redukcióra és drive-indukcióra is épülhet. Az ingerléses kísérleteket elsőként James Olds és Peter Milner alkalmazta (1954). A technika lényege az volt, hogy elektródákat építettek be patkányok egyik kéreg alatti struktúrájába, a septumba. Kiderült, hogy a septum rövid, enyhe elektromos ingerlése megerősítőként működött, az állatok a ketrecnek abba részébe tértek vissza, ahol az ingerlést kapták. Ezt követően Olds és Milner az ingerlő elektródákat egy válaszpedállal kapcsolta össze. Legnagyobb meglepetésükre azt tapasztalták, hogy a patkányok nagy pedálnyomási gyakorisággal, órákig ingerelték magukat. A jelenséget intrakraniális öningerlésnek nevezték el.

A kísérletekhez sokan azt a reményt fűzték, hogy sikerül a megerősítés univerzális mechanizmusának fiziológiáját feltárni. Tény, hogy gondosan ellenőrzött feltételek mellett az öningerlés sokban hasonlít a természetes megerősítők hatásához. Így például felmerült, hogy az öningerlés ugyanazokat a neurális mechanizmusokat aktiválja, mint amelyek a konszumációs viselkedés (táplálékfelvétel) során megfigyelhető drive-redukciót kísérik. Később azonban kiderült, hogy ez a magyarázat túl egyszerű, hiszen agyi ingerléssel táplálkozás, ivás és szexuális viselkedés is kiváltható. Az agyi ingerlés tehát sokkal inkább drive-ot indukál, mint redukál. A hatás attól függ, hogy az ingerelt agyi terület a fajra jellemző viselkedés kiváltásában szerepet játszik-e. Ezt erősítik meg azok a kísérleti eredmények, amelyek arra utalnak, hogy az ivást kiváltó ingerléssel aktiválható agyi területek öningerlése fokozódik, ha víz is rendelkezésre áll, illetve édes vízre ez még tovább nő (Philips-Mogenson, 1968). Ez hasonló a természetes instrumentális helyzethez, amelyben a megerősítő akkor hatékony, ha a külső inger az általános drive-állapottal egyszerre van jelen.

Megerősítés: válaszszabályozás

A megerősítés viselkedésszabályozási elméleteinek előfutára David Premacknak az 1960-as évek közepén végzett kísérletsorozata. Premack elképzelése az volt, hogy bizonyos válaszok önmagukért is megerősítőként működhetnek. Premack elméletének lényege, hogy instrumentális válasz és megerősítő között nincs lényeges különbség. Az ennek bizonyítására végzett kísérletre már korábban hivatkoztunk (gyerekek, akik a kísérlet első szakaszában édességet vagy játékot preferáltak, majd eltérően tanultak, az egyik csoport az édesség megszerzéséért játszott, a másik a játékért fogyasztott édességet; lásd 73. o.). Egy másik kísérletben Premack (1962) patkányokat vizsgált, az instrumentális választ a depriváció manipulálásával változtatta. A patkányokat vízivás és forgókerék használata során vizsgálták. Az egyik feltételben a patkányok vízmegvonást követően többet ittak, a forgókereket nem használták. A telítődött (szatiált) patkányok viszont többet futottak, mint ittak. Mindebből az következik, hogy a víz és a futás egyaránt lehet megerősítő, az pedig, hogy melyik válik éppen azzá, a patkány vízdeprivációs állapotától függ. Premack a deprivációt a megerősítés szükséges feltételének tekintette.

Megerősítés: a befolyásolás mint kognitív tényező

Az operáns kondicionálás elemzésében eddig számos olyan tényező szerepét mutattuk be, amelyek fontosak a viselkedéses válasz és a megerősítés összekapcsolásában. A kognitív tényezőkről eddig viszonylag kevés szó esett, jóllehet ezek az operáns kondicionálás egyes elméleteiben is fontos szerepet játszanak. Gyakran hasznos lehet úgy tekinteni az operáns kondicionálásra, hogy ezzel az élőlény valamilyen, mindenekelőtt válaszmegerősítő kapcsolatra vonatkozó tudást sajátít el. Hasonlóan a klasszikus kondicionálásban említettekhez, a viselkedéses válasz és a megerősítés időbeli érintkezése (kontiguitása) az operáns kondicionálásban is fontos tényező. Ezt már Skinner is fontosnak tartotta, amikor megállapította, hogy a válasz és a megerősítés akkor kapcsolódik össze, ha ezek időben érintkeznek, azaz a megerősítés bejósolható. Ezt nevezzük a kontiguitás törvényének.

A bejósolhatósághoz szorosan kapcsolódik a befolyásolhatóság. Ez azt jelenti, hogy egy válasz csak akkor kondicionálódik, ha az élőlény úgy értelmezi, hogy a megerősítés az ő válaszától függ. Maier és Seligman (1976) kísérletei szolgáltattak erre bizonyítékokat. Egyik kísérletük két szakaszból állt. Az első szakaszban a megerősítés szempontjából a kutyák úgynevezett összekapcsolt (angolul yoked) helyzetben voltak. Az állatok két csoportba tartoztak. Az egyikbe azok, amelyek megfelelő viselkedés elsajátításával elkerülhették az áramütést, a másikba pedig azok, amelyeknek nem volt befolyásuk a büntetésre. A kutyákat párosával tanították. A pár mindkét tagjának mozgását hevederekkel korlátozták, és időnként áramütést kaptak. Egyikük ki tudta kapcsolni az áramot, ha megnyomott az orrával egy gombot, a másik viszont nem tehetett semmit. Ha a nyomógombbal választ adó, tehát befolyásolásra képes kutya áramütést kapott, akkor a másik is, ha pedig sikerült elkerülnie az áramütést, a másik kutya sem kapta azt.

A kísérlet második szakaszában mindkét kutyát külön egy új berendezésbe tették, mégpedig egy olyan dobozba, amelyet egy fal két részre osztott. Ebben az ugrálóketrecben egy hang jelezte, hogy az a terület, ahol éppen a kutya tartózkodik, áram alá kerül-e. A kutyáknak azt kellett megtanulniuk, hogy a hangjelzésre átugorjanak a falon keresztül a másik részbe, ily módon elkerülve az áramütést. Az a kutya, amelyik előzőleg ki tudta kapcsolni az áramütést, gyorsan megtanulta ezt a választ. A másik egészen másként viselkedett: az elején nem ugrotta át a falat, és a próbák során viselkedése is egyre passzívabbá, végül pedig teljesen tehetetlenné vált. Az első szakaszban ugyanis megtanulta, hogy nincs befolyása az áramütésre, és ez a „hiedelem” lehetetlenné tette a kondicionálást a második szakaszban. Az operáns kondicionálás tehát csak akkor lehetséges, ha az élőlény úgy észleli, hogy a megerősítés az ő ellenőrzése, kontrollja alatt áll. A kontrollal kapcsolatban a csecsemők mobilimozgató rugdosásával kapcsolatban fentebb már szó volt.

Az eredményeket leírhatjuk kontingenciákkal (egybeesésekkel) is. Azt mondhatjuk, hogy operáns kondicionálás akkor történik, ha az élőlény egybeeséseket tapasztal válaszai és a megerősítések között. Az instrumentális tanulás formáinak bemutatását a kontingenciák elemzésével kezdtük. Itt most befejezésül annyit jegyzünk meg, hogy a kontingenciák elsajátítása univerzális tulajdonsága mind a klasszikus, mind az operáns kondicionálásnak. A kontingenciák tanulásának képességét ugyancsak a mobilkísérletben sikerült kimutatni. A csecsemők egyik csoportja fejfordítással mozgásba tudott hozni egy mobiljátékot, a fejfordítás és a mobil mozgása között tehát kontingencia volt. A csecsemők gyorsan megtanulták a fejfordítást, és az öröm jeleivel (mosoly, gügyögés) reagáltak a mobil mozgására. A helyzet egészen máshogy alakult a mobil mozgását a kontrollcsoport által szabályozottan követő kísérleti csoportban. A mobil játék mozgását ők nem befolyásolhatták, fejmozgásuk és a mobil mozgása között nem volt kontingencia. Ezek a gyerekek nem tanulták meg a fejüket gyakrabban fordítani, és egy idő után az öröm jeleit sem mutatták, a mobil a mozgására gyakorolt befolyás nélkül elvesztette megerősítő jellegét.

Az operáns kondicionálás korlátai

A biológiai tényezők az operáns kondicionálással tanulható viselkedést is behatárolják. Ennek egyik bizonyítéka az a viselkedéseltolódás néven ismertté vált jelenség, amelyet az operáns kondicionálással mutatványokra tanított állatoknál figyeltek meg. A megfigyelők arról számoltak be, hogy az állatok a kívánt viselkedés helyett időnként olyan más választ sajátítanak el, amely közelebb áll az ösztönös, a fajspecifikus viselkedéshez. Az egyik esetben például megpróbáltak csirkéket megtanítani arra, hogy nyugodtan álljanak egy emelvényen, de a csirkék ragaszkodtak a padló kapir- gálásához. A kapirgálás a csirkék olyan ösztönös élelemkereső viselkedése, amely erősen behatárolja, hogy mi tanulható meg.

Az operáns kondicionálás kutatása során a válaszmegerősítéssel kapcsolatban többféle korlátot is leírtak. Erre egyik példa a galambok kétféle tanulási helyzete: a jutalmazásos tanulás, ahol az állat egy élelemmel megerősített választ tanul meg; és a menekülő tanulás, ahol az állat egy olyan választ tanul meg, amelynek megerősítése a fájdalmas hatás (pl. áramütés) kikapcsolása. Jutalmazás esetén a galambok gyorsabban tanulnak, ha a válasz egy gomb csipegetése, mint ha szárnycsapkodás. Menekülés esetén ez pont fordítva van: gyorsabban tanulnak, ha a válasz szárnycsapkodás. A csipegetés a madarak természetes táplálkozási aktivitásának része, míg a veszélyre való természetes reakciójuk a szárnycsapkodás. Tehát az operáns kondicionálás inkább a viselkedési tervrajzba illeszkedő, mintsem önkényes asszociációk tanulásának eszköze.