tanulási célok
- vázolja fel az operáns kondicionálás elveit.
- magyarázza el, hogyan alakítható a tanulás megerősítési ütemtervek és másodlagos erősítők használatával.
a klasszikus kondicionálás során a szervezet megtanulja társítani az új ingereket a természetes biológiai válaszokkal, például a nyáladzással vagy a félelemmel. A szervezet nem tanul valami újat, hanem egy új jel jelenlétében elkezdi végrehajtani a meglévő viselkedést. Az operáns kondicionálás viszont olyan tanulás, amely a viselkedés következményein alapul, és magában foglalhatja az új cselekvések megtanulását. Operáns kondicionálás akkor fordul elő, amikor egy kutya parancsra átfordul, mert a múltban dicsérték ezért, amikor egy iskolai zaklató megfenyegeti osztálytársait, mert ez lehetővé teszi számára, hogy utat kapjon, és amikor egy gyermek jó osztályzatokat kap, mert a szülei azzal fenyegetnek, hogy megbüntetik, ha nem. Az operáns kondicionálás során a szervezet megtanulja saját cselekedeteinek következményeit.
hogyan befolyásolja a viselkedést a megerősítés és a büntetés: Thorndike és Skinner kutatása
Edward L. Thorndike (1874-1949) pszichológus volt az első tudós, aki szisztematikusan tanulmányozta az operáns kondicionálást. Kutatásában Thorndike (1898) olyan macskákat figyelt meg, akiket egy “puzzle-dobozba” helyeztek, ahonnan megpróbáltak elmenekülni (“videoklip: Thorndike Puzzle-doboza”). Először a macskák vakaróztak, haraptak és véletlenszerűen csapkodtak, anélkül, hogy tudták volna, hogyan kell kijutni. De végül, és véletlenül, megnyomták a kart, amely kinyitotta az ajtót, és kiléptek a zsákmányhoz, egy haldarabhoz. A következő alkalommal, amikor a macskát a dobozon belül korlátozták, a sikeres menekülés előtt kevesebb hatástalan választ próbált meg, és több kísérlet után a macska megtanulta, hogy szinte azonnal a helyes választ adja.
a macskák viselkedésében bekövetkezett változások megfigyelése arra késztette Thorndike-ot, hogy kifejlessze a hatás törvényét, azt az elvet, hogy azok a válaszok, amelyek egy adott helyzetben tipikusan kellemes eredményt hoznak létre, nagyobb valószínűséggel fordulnak elő hasonló helyzetben, míg a tipikusan kellemetlen eredményt produkáló válaszok kevésbé valószínűek, hogy újra előfordulnak a helyzetben (Thorndike, 1911). A hatás törvényének lényege, hogy a sikeres válaszokat, mivel kellemesek, a tapasztalat “bélyegzi”, és így gyakrabban fordul elő. A sikertelen válaszokat, amelyek kellemetlen élményeket okoznak, “kiürítik”, majd ritkábban fordulnak elő.
amikor Thorndike kirakósdobozba helyezte macskáit, úgy találta, hogy minden kísérlet után gyorsabban megtanultak részt venni a fontos menekülési viselkedésben. Thorndike leírta a megerősítést követő tanulást a hatás törvénye szempontjából.
nézze meg: “Thorndike Puzzle doboza” : http://www.youtube.com/watch?v=BDujDOLre-8
a befolyásos viselkedéspszichológus B. F. Skinner (1904-1990) kibővítette Thorndike ötleteit, hogy teljesebb alapelveket dolgozzon ki az operáns kondicionálás magyarázatára. Skinner speciálisan kialakított környezeteket hozott létre operáns kamrák (általában Skinner dobozoknak hívják) a tanulás szisztematikus tanulmányozására. A Skinner doboz (operáns kamra) olyan szerkezet, amely elég nagy ahhoz, hogy elférjen egy rágcsálóban vagy madárban, és tartalmaz egy rudat vagy kulcsot, amelyet a szervezet megnyomhat vagy megcsíphet, hogy ételt vagy vizet szabadítson fel. Tartalmaz egy eszközt az állat válaszainak rögzítésére (8.5.ábra).
Skinner kísérleteinek legalapvetőbb része meglehetősen hasonló volt Thorndike macskákkal végzett kutatásához. A kamrába helyezett patkány úgy reagált, ahogy az várható volt, a doboz körül rohangált, szaglászott és karmolt a padlón és a falakon. Végül a patkány egy karra esett, amelyet megnyomott, hogy elengedje az étel pelletjeit. A következő alkalommal a patkánynak valamivel kevesebb időre volt szüksége a kar megnyomásához, és az egymást követő kísérletekben a kar megnyomásához szükséges idő egyre rövidebb lett. Hamarosan a patkány olyan gyorsan megnyomta a kart, amennyire csak meg tudta enni a megjelenő ételt. Amint azt a hatás törvénye megjósolta, a patkány megtanulta megismételni azt a cselekedetet, amely az ételt hozta, és abbahagyta azokat a cselekedeteket, amelyek nem.
Skinner részletesen tanulmányozta, hogy az állatok hogyan változtatták meg viselkedésüket a megerősítés és a büntetés révén, és olyan kifejezéseket dolgozott ki, amelyek megmagyarázták az operáns tanulás folyamatait (8.1 táblázat, “hogyan befolyásolja a pozitív és negatív megerősítés és büntetés a viselkedést”). Skinner a megerősítő kifejezést minden olyan eseményre használta, amely erősíti vagy növeli a viselkedés valószínűségét, a punisher kifejezés pedig minden olyan eseményre utal, amely gyengíti vagy csökkenti a viselkedés valószínűségét. A pozitív és negatív kifejezéseket arra használta, hogy utaljon arra, hogy egy megerősítést bemutattak-e vagy eltávolítottak-e. Így a pozitív megerősítés erősíti a választ azáltal, hogy valami kellemeset mutat be a válasz után, a negatív megerősítés pedig erősíti a választ valami kellemetlen csökkentésével vagy eltávolításával. Például a gyermek dicsérete a házi feladat elvégzéséért pozitív megerősítést jelent, míg az aszpirin szedése a fejfájás fájdalmának csökkentése érdekében negatív megerősítést jelent. Mindkét esetben a megerősítés valószínűbbé teszi, hogy a viselkedés a jövőben ismét előfordul.
operáns kondicionáló kifejezés | leírás | eredmény | példa |
---|---|---|---|
pozitív megerősítés | kellemes inger hozzáadása vagy növelése | a viselkedés megerősödik | díjat adni egy hallgatónak, miután ötöst kapott egy teszten |
negatív megerősítés | csökkentse vagy távolítsa el a kellemetlen ingert | a viselkedés erősödik | fájdalomcsillapítók szedése, amelyek kiküszöbölik a fájdalmat, növeli annak valószínűségét, hogy ismét fájdalomcsillapítók |
pozitív büntetés | kellemetlen inger jelenléte vagy hozzáadása | a viselkedés gyengül | extra házi feladatot ad a tanulónak, miután rosszul viselkedett az osztályban |
negatív büntetés | csökkentse vagy távolítsa el a kellemes ingert | a viselkedés gyengül | egy tini számítógépének elvétele, miután elmulasztotta a kijárási tilalmat |
a pozitív vagy negatív megerősítés a viselkedés valószínűségének növelésével működik. A büntetés viszont minden olyan eseményre utal, amely gyengíti vagy csökkenti a viselkedés valószínűségét. A pozitív büntetés gyengíti a választ azáltal, hogy valami kellemetlen dolgot mutat be a válasz után, míg a negatív büntetés gyengíti a választ valami kellemes csökkentésével vagy eltávolításával. Az a gyermek, aki testvérével való harc után megalapozott (pozitív büntetés), vagy aki elveszíti a lehetőséget, hogy rossz osztályzat megszerzése után szünetet tartson (negatív büntetés), kevésbé valószínű, hogy megismétli ezeket a viselkedéseket.
bár a megerősítés (ami növeli a viselkedést) és a büntetés (ami csökkenti) közötti különbség általában egyértelmű, egyes esetekben nehéz meghatározni, hogy az erősítő pozitív vagy negatív. Egy forró napon a hűvös szellő pozitív erősítőnek (mert hűvös levegőt hoz) vagy negatív erősítőnek (mert eltávolítja a forró levegőt) tekinthető. Más esetekben a megerősítés mind pozitív, mind negatív lehet. Lehet cigarettázni mind azért, mert örömet okoz (pozitív megerősítés), mind azért, mert kiküszöböli a nikotin utáni vágyat (negatív megerősítés).
azt is fontos megjegyezni, hogy a megerősítés és a büntetés nem egyszerűen ellentétek. A pozitív megerősítés használata a viselkedés megváltoztatásában szinte mindig hatékonyabb, mint a büntetés. A pozitív megerősítés ugyanis jobban érzi magát az ember vagy az állat, segítve a pozitív kapcsolat kialakítását az erősítést nyújtó személlyel. A mindennapi életben hatékony pozitív megerősítés típusai közé tartozik a szóbeli dicséret vagy jóváhagyás, a státusz vagy presztízs odaítélése, valamint a közvetlen pénzügyi kifizetés. A büntetés viszont inkább csak átmeneti változásokat idéz elő a viselkedésben, mivel kényszerítésen alapul, és jellemzően negatív és kontradiktórius kapcsolatot teremt az erősítést nyújtó személlyel. Amikor a büntetést kiszabó személy elhagyja a helyzetet, a nem kívánt viselkedés valószínűleg visszatér.
komplex viselkedésformák létrehozása operáns kondicionálással
talán emlékszel arra, hogy néztél egy filmet, vagy olyan kiállításon voltál, ahol egy állat — talán egy kutya, egy ló vagy egy delfin — csodálatos dolgokat tett. Az edző parancsot adott, a delfin pedig a medence aljára úszott, felvett egy gyűrűt az orrán, kiugrott a vízből a levegőben lévő karikán keresztül, ismét a medence aljára merült, felvett egy másik gyűrűt, majd mindkét gyűrűt a medence szélén lévő edzőhöz vitte. Az állatot kiképezték erre a trükkre, és az operáns kondicionálás elveit használták a kiképzéshez. De ezek a komplex viselkedések messze vannak az egyszerű inger-válasz kapcsolatoktól, amelyeket eddig figyelembe vettünk. Hogyan lehet a megerősítést felhasználni az ilyen összetett viselkedések létrehozására?
az operáns tanulás használatának bővítésének egyik módja a megerősítés alkalmazásának ütemezésének módosítása. Eddig csak egy folyamatos megerősítési ütemtervet tárgyaltunk, amelyben a kívánt válasz minden alkalommal megerősödik; amikor például a kutya megfordul, kap egy kekszet. A folyamatos megerősítés viszonylag gyors tanulást eredményez, de a kívánt viselkedés gyors kihalását is eredményezi, amint az erősítő eltűnik. A probléma az, hogy mivel a szervezet megszokta, hogy minden viselkedés után megkapja a megerősítést, a válaszadó gyorsan feladhatja, ha nem jelenik meg.
a legtöbb valós erősítő nem folyamatos; részleges (vagy szakaszos) megerősítési ütemtervben fordulnak elő-olyan ütemtervben, amelyben a válaszokat néha megerősítik, néha nem. A folyamatos megerősítéshez képest a részleges megerősítési ütemtervek lassabb kezdeti tanuláshoz vezetnek, de nagyobb ellenállást is eredményeznek a kihalással szemben. Mivel a megerősítés nem jelenik meg minden viselkedés után, hosszabb időbe telik, amíg a tanuló megállapítja, hogy a jutalom már nem jön, és így a kihalás lassabb. A részleges megerősítési ütemtervek négy típusát a 8.2. táblázat foglalja össze, ” megerősítési ütemtervek.”
megerősítési ütemterv | magyarázat | valós példa |
---|---|---|
rögzített arány | a viselkedés meghatározott számú válasz után megerősödik. | gyári munkások, akiket az általuk gyártott termékek száma szerint fizetnek |
változó arány | a viselkedés egy átlagos, de kiszámíthatatlan számú válasz után megerősödik. | nyerőgépek és más szerencsejátékok kifizetései |
Fix intervallum | viselkedés megerősödik az első válasz után egy meghatározott idő telt el. | emberek, akik havi fizetést keresnek |
változó-intervallum | viselkedés megerősödik az első válasz után egy átlagos, de kiszámíthatatlan idő telt el. | személy, aki ellenőrzi e-mail üzenetek |
a részleges megerősítési ütemterveket az határozza meg, hogy a megerősítést a megerősítés között eltelt idő (intervallum) vagy a szervezet által végrehajtott válaszok száma (Arány) alapján mutatják-e be, valamint az, hogy a megerősítés rendszeres (rögzített) vagy kiszámíthatatlan (változó) ütemterv szerint történik-e. Rögzített intervallumú ütemtervben a megerősítés az első válaszra történik, amelyet egy meghatározott idő elteltével hajtanak végre. Például, egyperces rögzített intervallumú ütemterv szerint az állat percenként megerősítést kap, feltételezve, hogy a perc során legalább egyszer részt vesz a viselkedésben. Amint a 8.6. ábrán látható, “példák a különböző részleges megerősítési ütemtervek szerint kiképzett állatok Válaszmintáira”, a rögzített intervallumú ütemtervek alatt álló állatok hajlamosak lelassítani reakciójukat közvetlenül a megerősítés után, de aztán a következő megerősítés idejének közeledtével ismét növelik a viselkedést. (A legtöbb diák ugyanúgy tanul a vizsgákra.) Változó intervallumú ütemezésben az erősítők intervallum ütemezésen jelennek meg, de az időzítés az átlagos intervallum körül változik, így az erősítő tényleges megjelenése kiszámíthatatlan. Példa lehet az e-mail ellenőrzése: megerősíti az érkező üzenetek fogadása, átlagban, mond, minden 30 percek, de a megerősítés csak véletlenszerű időpontokban történik. Az intervallum megerősítési ütemtervek általában lassú és állandó válaszadási arányokat eredményeznek.
rögzített arányú ütemtervben a viselkedés meghatározott számú válasz után megerősödik. Például egy patkány viselkedése megerősíthető, miután 20-szor megnyomott egy gombot, vagy az eladó bónuszt kaphat, miután eladott 10 terméket. Amint az a 8. ábrán látható.6, “példák a különböző részleges megerősítési ütemterv szerint kiképzett állatok Válaszmintáira”, miután a szervezet megtanulta a rögzített arányú ütemtervnek megfelelően cselekedni, csak rövid ideig szünetel, amikor megerősítés történik, mielőtt visszatérne a magas szintű reakcióképességhez. A Változó arányú ütemezés erősítőket biztosít egy adott, de átlagos válaszszám után. A pénznyerő automatákból vagy a sorsjegyből nyert pénz egy példa a megerősítésre, amely Változó arányú ütemterv szerint történik. Például egy játékgép (lásd a 8. ábrát.7, “Slot Machine”) lehet programozni, hogy a győzelem minden 20 alkalommal a felhasználó húzza a fogantyút, átlagban. Az arány ütemezése általában magas válaszadási arányt eredményez, mivel a megerősítés növekszik a válaszok számának növekedésével.
komplex viselkedések is létrejönnek alakítás, az a folyamat, amely egy szervezet viselkedését a kívánt eredményhez irányítja a végső kívánt viselkedéshez való egymást követő közelítés alkalmazásával. Skinner széles körben alkalmazta ezt az eljárást a dobozaiban. Például kiképezhetett egy patkányt, hogy kétszer nyomja meg a rudat, hogy élelmet kapjon, először élelmet biztosítva, amikor az állat a bár közelében mozgott. Amikor ezt a viselkedést megtanulták, Skinner csak akkor kezdett élelmet biztosítani, amikor a patkány megérintette a rudat. A további alakítás csak akkor korlátozta a megerősítést, amikor a patkány megnyomta a rudat, amikor megnyomta a rudat, és másodszor megérintette, végül csak akkor, amikor kétszer megnyomta a rudat. Bár ez hosszú időt vehet igénybe, ily módon az operáns kondicionálás viselkedési láncokat hozhat létre, amelyeket csak akkor erősítenek meg, amikor befejeződnek.
az állatok megerősítése, ha helyesen különböztetik meg a hasonló ingereket, lehetővé teszi a tudósok számára, hogy teszteljék az állatok tanulási képességét, és néha figyelemre méltó a megkülönböztetés. A galambokat arra képezték ki, hogy különbséget tegyenek Charlie Brown és a többi Peanuts karakter képei között (Cerella, 1980), valamint a különböző zenei és művészeti stílusok között (Porter & Neuringer, 1984; Watanabe, Sakamoto & Wakita, 1995).
a viselkedés másodlagos erősítők használatával is kiképezhető. Míg az elsődleges erősítő olyan ingereket tartalmaz, amelyeket a szervezet természetesen előnyben részesít vagy élvez, mint például az étel, a víz és a fájdalom enyhítése, a másodlagos erősítő (néha kondicionált erősítőnek hívják) semleges esemény, amely a klasszikus kondicionálás révén az elsődleges megerősítőhöz kapcsolódik. A másodlagos erősítőre példa lehet az állatidomár által adott síp, amelyet az idő múlásával társítottak az elsődleges erősítővel, az étellel. A mindennapi másodlagos megerősítésre példa a pénz. Élvezzük a pénz birtoklását, nem annyira magának az ingernek, hanem inkább az elsődleges erősítőknek (azoknak a dolgoknak, amelyeket a pénz megvásárolhat), amelyekhez kapcsolódik.
kulcs elvihető
- Edward Thorndike kifejlesztette a hatás törvényét: az az elv, hogy azok a válaszok, amelyek egy adott helyzetben jellemzően kellemes eredményt hoznak létre, nagyobb valószínűséggel fordulnak elő újra hasonló helyzetben, míg a tipikusan kellemetlen eredményt produkáló válaszok kevésbé valószínűek, hogy újra előfordulnak a helyzetben.
- B. F. Skinner kibővítette Thorndike ötleteit, hogy dolgozzon ki egy sor alapelvet az operáns kondicionálás magyarázatára.
- a pozitív megerősítés erősíti a választ azáltal, hogy bemutat valamit, ami tipikusan kellemes a válasz után, míg a negatív megerősítés erősíti a választ azáltal, hogy csökkenti vagy eltávolítja valamit, ami általában kellemetlen.
- a pozitív büntetés gyengíti a választ azáltal, hogy valami tipikusan kellemetlen dolgot mutat be a válasz után, míg a negatív büntetés gyengíti a választ azáltal, hogy csökkenti vagy eltávolítja valamit, ami általában kellemes.
- a megerősítés lehet részleges vagy folyamatos. A részleges megerősítési ütemtervet az határozza meg, hogy a megerősítést a megerősítések között eltelt idő (intervallum) vagy az organizmus által kiváltott válaszok száma (Arány) alapján mutatják-e be, valamint az, hogy a megerősítés rendszeres (rögzített) vagy kiszámíthatatlan (változó) ütemterv szerint történik-e.
- komplex viselkedések alakítással hozhatók létre, amely folyamat egy szervezet viselkedését a kívánt eredményhez irányítja a végső kívánt viselkedéshez való egymást követő közelítés alkalmazásával.
gyakorlatok és kritikai gondolkodás
- adjon példát a mindennapi életből az alábbiak mindegyikére: pozitív megerősítés, negatív megerősítés, pozitív büntetés, negatív büntetés.
- fontolja meg azokat a megerősítési technikákat, amelyekkel kiképezheti a kutyát, hogy elkapjon és visszaszerezze a hozzá dobott Frizbit.
- nézze meg a következő két videót az aktuális televíziós műsorokból. Meg tudja határozni, hogy mely tanulási eljárásokat mutatják be?
- az iroda: http://www.break.com/usercontent/2009/11/the-office-altoid-kísérlet-1499823
- az ősrobbanás elmélete : http://www.youtube.com/watch?v=JA96Fba-WHk
Cerella, J. (1980). A galamb elemzése a képekről. Minta Felismerés, 12, 1-6.
Thorndike, E. L. (1898). Állati intelligencia: az állatok asszociatív folyamatainak kísérleti vizsgálata. Washington, DC: Amerikai Pszichológiai Egyesület.
Képjellemzők
8.6. Ábra: Átvéve Kassin (2003).