8.2 viselkedés megváltoztatása megerősítéssel és büntetéssel: operáns kondicionálás – Bevezetés a pszichológiába – 1.kanadai kiadás

tanulási célok
hogyan befolyásolja a viselkedést a megerősítés és a büntetés: Thorndike és Skinner kutatása
komplex viselkedésformák létrehozása operáns kondicionálással
kulcs elvihető
gyakorlatok és kritikai gondolkodás
Képjellemzők

tanulási célok

vázolja fel az operáns kondicionálás elveit.
magyarázza el, hogyan alakítható a tanulás megerősítési ütemtervek és másodlagos erősítők használatával.

a klasszikus kondicionálás során a szervezet megtanulja társítani az új ingereket a természetes biológiai válaszokkal, például a nyáladzással vagy a félelemmel. A szervezet nem tanul valami újat, hanem egy új jel jelenlétében elkezdi végrehajtani a meglévő viselkedést. Az operáns kondicionálás viszont olyan tanulás, amely a viselkedés következményein alapul, és magában foglalhatja az új cselekvések megtanulását. Operáns kondicionálás akkor fordul elő, amikor egy kutya parancsra átfordul, mert a múltban dicsérték ezért, amikor egy iskolai zaklató megfenyegeti osztálytársait, mert ez lehetővé teszi számára, hogy utat kapjon, és amikor egy gyermek jó osztályzatokat kap, mert a szülei azzal fenyegetnek, hogy megbüntetik, ha nem. Az operáns kondicionálás során a szervezet megtanulja saját cselekedeteinek következményeit.

hogyan befolyásolja a viselkedést a megerősítés és a büntetés: Thorndike és Skinner kutatása

Edward L. Thorndike (1874-1949) pszichológus volt az első tudós, aki szisztematikusan tanulmányozta az operáns kondicionálást. Kutatásában Thorndike (1898) olyan macskákat figyelt meg, akiket egy “puzzle-dobozba” helyeztek, ahonnan megpróbáltak elmenekülni (“videoklip: Thorndike Puzzle-doboza”). Először a macskák vakaróztak, haraptak és véletlenszerűen csapkodtak, anélkül, hogy tudták volna, hogyan kell kijutni. De végül, és véletlenül, megnyomták a kart, amely kinyitotta az ajtót, és kiléptek a zsákmányhoz, egy haldarabhoz. A következő alkalommal, amikor a macskát a dobozon belül korlátozták, a sikeres menekülés előtt kevesebb hatástalan választ próbált meg, és több kísérlet után a macska megtanulta, hogy szinte azonnal a helyes választ adja.

a macskák viselkedésében bekövetkezett változások megfigyelése arra késztette Thorndike-ot, hogy kifejlessze a hatás törvényét, azt az elvet, hogy azok a válaszok, amelyek egy adott helyzetben tipikusan kellemes eredményt hoznak létre, nagyobb valószínűséggel fordulnak elő hasonló helyzetben, míg a tipikusan kellemetlen eredményt produkáló válaszok kevésbé valószínűek, hogy újra előfordulnak a helyzetben (Thorndike, 1911). A hatás törvényének lényege, hogy a sikeres válaszokat, mivel kellemesek, a tapasztalat “bélyegzi”, és így gyakrabban fordul elő. A sikertelen válaszokat, amelyek kellemetlen élményeket okoznak, “kiürítik”, majd ritkábban fordulnak elő.

amikor Thorndike kirakósdobozba helyezte macskáit, úgy találta, hogy minden kísérlet után gyorsabban megtanultak részt venni a fontos menekülési viselkedésben. Thorndike leírta a megerősítést követő tanulást a hatás törvénye szempontjából.

nézze meg: “Thorndike Puzzle doboza” : http://www.youtube.com/watch?v=BDujDOLre-8

a befolyásos viselkedéspszichológus B. F. Skinner (1904-1990) kibővítette Thorndike ötleteit, hogy teljesebb alapelveket dolgozzon ki az operáns kondicionálás magyarázatára. Skinner speciálisan kialakított környezeteket hozott létre operáns kamrák (általában Skinner dobozoknak hívják) a tanulás szisztematikus tanulmányozására. A Skinner doboz (operáns kamra) olyan szerkezet, amely elég nagy ahhoz, hogy elférjen egy rágcsálóban vagy madárban, és tartalmaz egy rudat vagy kulcsot, amelyet a szervezet megnyomhat vagy megcsíphet, hogy ételt vagy vizet szabadítson fel. Tartalmaz egy eszközt az állat válaszainak rögzítésére (8.5.ábra).

Skinner kísérleteinek legalapvetőbb része meglehetősen hasonló volt Thorndike macskákkal végzett kutatásához. A kamrába helyezett patkány úgy reagált, ahogy az várható volt, a doboz körül rohangált, szaglászott és karmolt a padlón és a falakon. Végül a patkány egy karra esett, amelyet megnyomott, hogy elengedje az étel pelletjeit. A következő alkalommal a patkánynak valamivel kevesebb időre volt szüksége a kar megnyomásához, és az egymást követő kísérletekben a kar megnyomásához szükséges idő egyre rövidebb lett. Hamarosan a patkány olyan gyorsan megnyomta a kart, amennyire csak meg tudta enni a megjelenő ételt. Amint azt a hatás törvénye megjósolta, a patkány megtanulta megismételni azt a cselekedetet, amely az ételt hozta, és abbahagyta azokat a cselekedeteket, amelyek nem.

Skinner részletesen tanulmányozta, hogy az állatok hogyan változtatták meg viselkedésüket a megerősítés és a büntetés révén, és olyan kifejezéseket dolgozott ki, amelyek megmagyarázták az operáns tanulás folyamatait (8.1 táblázat, “hogyan befolyásolja a pozitív és negatív megerősítés és büntetés a viselkedést”). Skinner a megerősítő kifejezést minden olyan eseményre használta, amely erősíti vagy növeli a viselkedés valószínűségét, a punisher kifejezés pedig minden olyan eseményre utal, amely gyengíti vagy csökkenti a viselkedés valószínűségét. A pozitív és negatív kifejezéseket arra használta, hogy utaljon arra, hogy egy megerősítést bemutattak-e vagy eltávolítottak-e. Így a pozitív megerősítés erősíti a választ azáltal, hogy valami kellemeset mutat be a válasz után, a negatív megerősítés pedig erősíti a választ valami kellemetlen csökkentésével vagy eltávolításával. Például a gyermek dicsérete a házi feladat elvégzéséért pozitív megerősítést jelent, míg az aszpirin szedése a fejfájás fájdalmának csökkentése érdekében negatív megerősítést jelent. Mindkét esetben a megerősítés valószínűbbé teszi, hogy a viselkedés a jövőben ismét előfordul.

Ábra 8.5 Skinner Box. B. F. Skinner egy Skinner dobozt használt az operáns tanulás tanulmányozására. A doboz tartalmaz egy sávot vagy kulcsot, amelyet a szervezet megnyomhat, hogy megkapja az ételt és a vizet, valamint egy eszközt, amely rögzíti a szervezet válaszait.

8. táblázat.1 A pozitív és negatív megerősítés és büntetés hogyan befolyásolja a viselkedést.
operáns kondicionáló kifejezés	leírás	eredmény	példa

pozitív megerősítés	kellemes inger hozzáadása vagy növelése	a viselkedés megerősödik	díjat adni egy hallgatónak, miután ötöst kapott egy teszten
negatív megerősítés	csökkentse vagy távolítsa el a kellemetlen ingert	a viselkedés erősödik	fájdalomcsillapítók szedése, amelyek kiküszöbölik a fájdalmat, növeli annak valószínűségét, hogy ismét fájdalomcsillapítók
pozitív büntetés	kellemetlen inger jelenléte vagy hozzáadása	a viselkedés gyengül	extra házi feladatot ad a tanulónak, miután rosszul viselkedett az osztályban
negatív büntetés	csökkentse vagy távolítsa el a kellemes ingert	a viselkedés gyengül	egy tini számítógépének elvétele, miután elmulasztotta a kijárási tilalmat

a pozitív vagy negatív megerősítés a viselkedés valószínűségének növelésével működik. A büntetés viszont minden olyan eseményre utal, amely gyengíti vagy csökkenti a viselkedés valószínűségét. A pozitív büntetés gyengíti a választ azáltal, hogy valami kellemetlen dolgot mutat be a válasz után, míg a negatív büntetés gyengíti a választ valami kellemes csökkentésével vagy eltávolításával. Az a gyermek, aki testvérével való harc után megalapozott (pozitív büntetés), vagy aki elveszíti a lehetőséget, hogy rossz osztályzat megszerzése után szünetet tartson (negatív büntetés), kevésbé valószínű, hogy megismétli ezeket a viselkedéseket.

bár a megerősítés (ami növeli a viselkedést) és a büntetés (ami csökkenti) közötti különbség általában egyértelmű, egyes esetekben nehéz meghatározni, hogy az erősítő pozitív vagy negatív. Egy forró napon a hűvös szellő pozitív erősítőnek (mert hűvös levegőt hoz) vagy negatív erősítőnek (mert eltávolítja a forró levegőt) tekinthető. Más esetekben a megerősítés mind pozitív, mind negatív lehet. Lehet cigarettázni mind azért, mert örömet okoz (pozitív megerősítés), mind azért, mert kiküszöböli a nikotin utáni vágyat (negatív megerősítés).

azt is fontos megjegyezni, hogy a megerősítés és a büntetés nem egyszerűen ellentétek. A pozitív megerősítés használata a viselkedés megváltoztatásában szinte mindig hatékonyabb, mint a büntetés. A pozitív megerősítés ugyanis jobban érzi magát az ember vagy az állat, segítve a pozitív kapcsolat kialakítását az erősítést nyújtó személlyel. A mindennapi életben hatékony pozitív megerősítés típusai közé tartozik a szóbeli dicséret vagy jóváhagyás, a státusz vagy presztízs odaítélése, valamint a közvetlen pénzügyi kifizetés. A büntetés viszont inkább csak átmeneti változásokat idéz elő a viselkedésben, mivel kényszerítésen alapul, és jellemzően negatív és kontradiktórius kapcsolatot teremt az erősítést nyújtó személlyel. Amikor a büntetést kiszabó személy elhagyja a helyzetet, a nem kívánt viselkedés valószínűleg visszatér.

komplex viselkedésformák létrehozása operáns kondicionálással

talán emlékszel arra, hogy néztél egy filmet, vagy olyan kiállításon voltál, ahol egy állat — talán egy kutya, egy ló vagy egy delfin — csodálatos dolgokat tett. Az edző parancsot adott, a delfin pedig a medence aljára úszott, felvett egy gyűrűt az orrán, kiugrott a vízből a levegőben lévő karikán keresztül, ismét a medence aljára merült, felvett egy másik gyűrűt, majd mindkét gyűrűt a medence szélén lévő edzőhöz vitte. Az állatot kiképezték erre a trükkre, és az operáns kondicionálás elveit használták a kiképzéshez. De ezek a komplex viselkedések messze vannak az egyszerű inger-válasz kapcsolatoktól, amelyeket eddig figyelembe vettünk. Hogyan lehet a megerősítést felhasználni az ilyen összetett viselkedések létrehozására?

az operáns tanulás használatának bővítésének egyik módja a megerősítés alkalmazásának ütemezésének módosítása. Eddig csak egy folyamatos megerősítési ütemtervet tárgyaltunk, amelyben a kívánt válasz minden alkalommal megerősödik; amikor például a kutya megfordul, kap egy kekszet. A folyamatos megerősítés viszonylag gyors tanulást eredményez, de a kívánt viselkedés gyors kihalását is eredményezi, amint az erősítő eltűnik. A probléma az, hogy mivel a szervezet megszokta, hogy minden viselkedés után megkapja a megerősítést, a válaszadó gyorsan feladhatja, ha nem jelenik meg.

a legtöbb valós erősítő nem folyamatos; részleges (vagy szakaszos) megerősítési ütemtervben fordulnak elő-olyan ütemtervben, amelyben a válaszokat néha megerősítik, néha nem. A folyamatos megerősítéshez képest a részleges megerősítési ütemtervek lassabb kezdeti tanuláshoz vezetnek, de nagyobb ellenállást is eredményeznek a kihalással szemben. Mivel a megerősítés nem jelenik meg minden viselkedés után, hosszabb időbe telik, amíg a tanuló megállapítja, hogy a jutalom már nem jön, és így a kihalás lassabb. A részleges megerősítési ütemtervek négy típusát a 8.2. táblázat foglalja össze, ” megerősítési ütemtervek.”

8.2. Táblázat Megerősítési Ütemtervek.
megerősítési ütemterv	magyarázat	valós példa

rögzített arány	a viselkedés meghatározott számú válasz után megerősödik.	gyári munkások, akiket az általuk gyártott termékek száma szerint fizetnek
változó arány	a viselkedés egy átlagos, de kiszámíthatatlan számú válasz után megerősödik.	nyerőgépek és más szerencsejátékok kifizetései
Fix intervallum	viselkedés megerősödik az első válasz után egy meghatározott idő telt el.	emberek, akik havi fizetést keresnek
változó-intervallum	viselkedés megerősödik az első válasz után egy átlagos, de kiszámíthatatlan idő telt el.	személy, aki ellenőrzi e-mail üzenetek

a részleges megerősítési ütemterveket az határozza meg, hogy a megerősítést a megerősítés között eltelt idő (intervallum) vagy a szervezet által végrehajtott válaszok száma (Arány) alapján mutatják-e be, valamint az, hogy a megerősítés rendszeres (rögzített) vagy kiszámíthatatlan (változó) ütemterv szerint történik-e. Rögzített intervallumú ütemtervben a megerősítés az első válaszra történik, amelyet egy meghatározott idő elteltével hajtanak végre. Például, egyperces rögzített intervallumú ütemterv szerint az állat percenként megerősítést kap, feltételezve, hogy a perc során legalább egyszer részt vesz a viselkedésben. Amint a 8.6. ábrán látható, “példák a különböző részleges megerősítési ütemtervek szerint kiképzett állatok Válaszmintáira”, a rögzített intervallumú ütemtervek alatt álló állatok hajlamosak lelassítani reakciójukat közvetlenül a megerősítés után, de aztán a következő megerősítés idejének közeledtével ismét növelik a viselkedést. (A legtöbb diák ugyanúgy tanul a vizsgákra.) Változó intervallumú ütemezésben az erősítők intervallum ütemezésen jelennek meg, de az időzítés az átlagos intervallum körül változik, így az erősítő tényleges megjelenése kiszámíthatatlan. Példa lehet az e-mail ellenőrzése: megerősíti az érkező üzenetek fogadása, átlagban, mond, minden 30 percek, de a megerősítés csak véletlenszerű időpontokban történik. Az intervallum megerősítési ütemtervek általában lassú és állandó válaszadási arányokat eredményeznek.

8.6. ábra példák a különböző részleges megerősítési ütemterv szerint kiképzett állatok Válaszmintáira. A válaszok számán alapuló ütemezések (aránytípusok) nagyobb válaszadási arányt indukálnak, mint az eltelt idő (intervallumtípusok) alapján. A kiszámíthatatlan ütemezések (változó típusok) erősebb válaszokat adnak, mint a kiszámítható ütemezések (rögzített típusok).

rögzített arányú ütemtervben a viselkedés meghatározott számú válasz után megerősödik. Például egy patkány viselkedése megerősíthető, miután 20-szor megnyomott egy gombot, vagy az eladó bónuszt kaphat, miután eladott 10 terméket. Amint az a 8. ábrán látható.6, “példák a különböző részleges megerősítési ütemterv szerint kiképzett állatok Válaszmintáira”, miután a szervezet megtanulta a rögzített arányú ütemtervnek megfelelően cselekedni, csak rövid ideig szünetel, amikor megerősítés történik, mielőtt visszatérne a magas szintű reakcióképességhez. A Változó arányú ütemezés erősítőket biztosít egy adott, de átlagos válaszszám után. A pénznyerő automatákból vagy a sorsjegyből nyert pénz egy példa a megerősítésre, amely Változó arányú ütemterv szerint történik. Például egy játékgép (lásd a 8. ábrát.7, “Slot Machine”) lehet programozni, hogy a győzelem minden 20 alkalommal a felhasználó húzza a fogantyút, átlagban. Az arány ütemezése általában magas válaszadási arányt eredményez, mivel a megerősítés növekszik a válaszok számának növekedésével.

Ábra 8.7 Játékgép. A nyerőgépek a Változó arányú megerősítési ütemterv példái.

komplex viselkedések is létrejönnek alakítás, az a folyamat, amely egy szervezet viselkedését a kívánt eredményhez irányítja a végső kívánt viselkedéshez való egymást követő közelítés alkalmazásával. Skinner széles körben alkalmazta ezt az eljárást a dobozaiban. Például kiképezhetett egy patkányt, hogy kétszer nyomja meg a rudat, hogy élelmet kapjon, először élelmet biztosítva, amikor az állat a bár közelében mozgott. Amikor ezt a viselkedést megtanulták, Skinner csak akkor kezdett élelmet biztosítani, amikor a patkány megérintette a rudat. A további alakítás csak akkor korlátozta a megerősítést, amikor a patkány megnyomta a rudat, amikor megnyomta a rudat, és másodszor megérintette, végül csak akkor, amikor kétszer megnyomta a rudat. Bár ez hosszú időt vehet igénybe, ily módon az operáns kondicionálás viselkedési láncokat hozhat létre, amelyeket csak akkor erősítenek meg, amikor befejeződnek.

az állatok megerősítése, ha helyesen különböztetik meg a hasonló ingereket, lehetővé teszi a tudósok számára, hogy teszteljék az állatok tanulási képességét, és néha figyelemre méltó a megkülönböztetés. A galambokat arra képezték ki, hogy különbséget tegyenek Charlie Brown és a többi Peanuts karakter képei között (Cerella, 1980), valamint a különböző zenei és művészeti stílusok között (Porter & Neuringer, 1984; Watanabe, Sakamoto & Wakita, 1995).

a viselkedés másodlagos erősítők használatával is kiképezhető. Míg az elsődleges erősítő olyan ingereket tartalmaz, amelyeket a szervezet természetesen előnyben részesít vagy élvez, mint például az étel, a víz és a fájdalom enyhítése, a másodlagos erősítő (néha kondicionált erősítőnek hívják) semleges esemény, amely a klasszikus kondicionálás révén az elsődleges megerősítőhöz kapcsolódik. A másodlagos erősítőre példa lehet az állatidomár által adott síp, amelyet az idő múlásával társítottak az elsődleges erősítővel, az étellel. A mindennapi másodlagos megerősítésre példa a pénz. Élvezzük a pénz birtoklását, nem annyira magának az ingernek, hanem inkább az elsődleges erősítőknek (azoknak a dolgoknak, amelyeket a pénz megvásárolhat), amelyekhez kapcsolódik.

kulcs elvihető

Edward Thorndike kifejlesztette a hatás törvényét: az az elv, hogy azok a válaszok, amelyek egy adott helyzetben jellemzően kellemes eredményt hoznak létre, nagyobb valószínűséggel fordulnak elő újra hasonló helyzetben, míg a tipikusan kellemetlen eredményt produkáló válaszok kevésbé valószínűek, hogy újra előfordulnak a helyzetben.
B. F. Skinner kibővítette Thorndike ötleteit, hogy dolgozzon ki egy sor alapelvet az operáns kondicionálás magyarázatára.
a pozitív megerősítés erősíti a választ azáltal, hogy bemutat valamit, ami tipikusan kellemes a válasz után, míg a negatív megerősítés erősíti a választ azáltal, hogy csökkenti vagy eltávolítja valamit, ami általában kellemetlen.
a pozitív büntetés gyengíti a választ azáltal, hogy valami tipikusan kellemetlen dolgot mutat be a válasz után, míg a negatív büntetés gyengíti a választ azáltal, hogy csökkenti vagy eltávolítja valamit, ami általában kellemes.
a megerősítés lehet részleges vagy folyamatos. A részleges megerősítési ütemtervet az határozza meg, hogy a megerősítést a megerősítések között eltelt idő (intervallum) vagy az organizmus által kiváltott válaszok száma (Arány) alapján mutatják-e be, valamint az, hogy a megerősítés rendszeres (rögzített) vagy kiszámíthatatlan (változó) ütemterv szerint történik-e.
komplex viselkedések alakítással hozhatók létre, amely folyamat egy szervezet viselkedését a kívánt eredményhez irányítja a végső kívánt viselkedéshez való egymást követő közelítés alkalmazásával.

gyakorlatok és kritikai gondolkodás

adjon példát a mindennapi életből az alábbiak mindegyikére: pozitív megerősítés, negatív megerősítés, pozitív büntetés, negatív büntetés.
fontolja meg azokat a megerősítési technikákat, amelyekkel kiképezheti a kutyát, hogy elkapjon és visszaszerezze a hozzá dobott Frizbit.
nézze meg a következő két videót az aktuális televíziós műsorokból. Meg tudja határozni, hogy mely tanulási eljárásokat mutatják be?
1. az iroda: http://www.break.com/usercontent/2009/11/the-office-altoid-kísérlet-1499823
2. az ősrobbanás elmélete : http://www.youtube.com/watch?v=JA96Fba-WHk

Cerella, J. (1980). A galamb elemzése a képekről. Minta Felismerés, 12, 1-6.

Thorndike, E. L. (1898). Állati intelligencia: az állatok asszociatív folyamatainak kísérleti vizsgálata. Washington, DC: Amerikai Pszichológiai Egyesület.

Képjellemzők

8.6. Ábra: Átvéve Kassin (2003).

Bevezetés a pszichológiába – 1. kanadai kiadás

tanulási célok

hogyan befolyásolja a viselkedést a megerősítés és a büntetés: Thorndike és Skinner kutatása

komplex viselkedésformák létrehozása operáns kondicionálással

kulcs elvihető

gyakorlatok és kritikai gondolkodás

Képjellemzők

Vélemény, hozzászólás? Kilépés a válaszból

Kis jelek arra, hogy ő az, akivel Megöregedhetsz

10 legjobb jóga alkalmazások letölthető közben' újra gyakorló otthon

Bevezetés a pszichológiába – 1. kanadai kiadás

tanulási célok

hogyan befolyásolja a viselkedést a megerősítés és a büntetés: Thorndike és Skinner kutatása

komplex viselkedésformák létrehozása operáns kondicionálással

kulcs elvihető

gyakorlatok és kritikai gondolkodás

Képjellemzők

Vélemény, hozzászólás? Kilépés a válaszból

More:

Kis jelek arra, hogy ő az, akivel Megöregedhetsz

10 legjobb jóga alkalmazások letölthető közben' újra gyakorló otthon