Introduksjon Til Psykologi-1. Kanadiske Utgave

Læringsmål

  1. Skissere prinsippene for operant betinging.
  2. Forklar hvordan læring kan formes gjennom bruk av forsterkningsplaner og sekundære forsterkere.

i klassisk kondisjonering lærer organismen å knytte nye stimuli til naturlige biologiske responser som salivasjon eller frykt. Organismen lærer ikke noe nytt, men begynner å utføre en eksisterende oppførsel i nærvær av et nytt signal. Operant betinging, derimot, er læring som skjer basert på konsekvensene av atferd og kan innebære læring av nye handlinger. Operant betinging oppstår når en hund ruller over på kommando fordi det har blitt rost for å gjøre det i det siste, når en skolerom bølle truer sine klassekamerater fordi dette tillater ham å få sin vei, og når et barn får gode karakterer fordi foreldrene truer med å straffe henne hvis hun ikke gjør det. I operant betinging lærer organismen av konsekvensene av sine egne handlinger.

Hvordan Forsterkning Og Straff Påvirker Atferd: Forskningen Til Thorndike Og Skinner

Psykolog Edward L. Thorndike (1874-1949) var den første forskeren som systematisk studerte operant betinging. I Sin forskning Observerte Thorndike (1898) katter som hadde blitt plassert i en «puslespillboks» som de prøvde å flykte fra («Videoklipp: Thorndike ‘ S Puzzle Box»). Ved første kattene riper, bit, og swatted måfå, uten noen ide om hvordan å komme seg ut. Men til slutt, og ved et uhell, de presset spaken som åpnet døren og gikk ut til sin premie, et skrap av fisk. Neste gang katten var begrenset i boksen, forsøkte den færre av de ineffektive responsene før den utførte den vellykkede flukten, og etter flere forsøk lærte katten nesten umiddelbart å gjøre det riktige svaret.

Å Observere disse endringene i kattens oppførsel førte Til At Thorndike utviklet sin lov om effekt, prinsippet om at svar som skaper et typisk hyggelig utfall i en bestemt situasjon, er mer sannsynlig å forekomme igjen i en lignende situasjon, mens svar som gir et typisk ubehagelig utfall, er mindre sannsynlig å forekomme igjen i situasjonen (Thorndike, 1911). Essensen av loven om effekt er at vellykkede svar, fordi de er behagelige, er «stemplet inn» av erfaring og dermed forekommer oftere. Mislykkede svar, som gir ubehagelige opplevelser, blir «stemplet ut» og forekommer senere sjeldnere.

Da Thorndike plasserte kattene sine i en puslespillboks, fant Han ut at de lærte å engasjere seg i den viktige fluktadferden raskere etter hvert forsøk. Thorndike beskrev læringen som følger forsterkning i form av loven om effekt.

Se: «Thorndike Puslespill Boks» : http://www.youtube.com/watch?v=BDujDOLre-8

den innflytelsesrike atferdspsykologen B. F. Skinner (1904-1990) utvidet Thorndikes ideer for å utvikle et mer komplett sett med prinsipper for å forklare operant betinging. Skinner opprettet spesialdesignede miljøer kjent som operant chambers (vanligvis kalt Skinner boxes) for systematisk å studere læring. En Skinner boks (operant kammer) er en struktur som er stor nok til å passe en gnager eller fugl, og som inneholder en bar eller nøkkel som organismen kan trykke eller hakke for å frigjøre mat eller vann. Den inneholder også en enhet for å registrere dyrets svar (Figur 8.5).

Den mest grunnleggende Av Skinners eksperimenter var ganske lik Thorndikes forskning med katter. En rotte plassert i kammeret reagerte som man kunne forvente, scurrying om boksen og snuse og klore på gulv og vegger. Til slutt rotta chanced på en spak, som det presset til å frigjøre pellets av mat. Neste gang tok rotten litt mindre tid til å trykke på spaken, og i suksessive forsøk ble tiden det tok å trykke på spaken kortere og kortere. Snart rotten var å trykke spaken så fort som det kunne spise maten som dukket opp. Som forutsagt av loven om effekt, hadde rotten lært å gjenta handlingen som førte til maten og opphøre handlingene som ikke gjorde det.

Skinner studerte i detalj hvordan dyr endret sin oppførsel gjennom forsterkning og straff, og han utviklet begreper som forklarte prosessene for operant læring (Tabell 8.1, «Hvordan Positiv Og Negativ Forsterkning Og Straff Påvirker Atferd»). Skinner brukte begrepet reinforcer for å referere til enhver hendelse som styrker eller øker sannsynligheten for en oppførsel, og begrepet punisher for å referere til enhver hendelse som svekker eller reduserer sannsynligheten for en oppførsel. Og han brukte begrepene positive og negative for å referere til om en forsterkning ble presentert eller fjernet, henholdsvis. Dermed styrker positiv forsterkning et svar ved å presentere noe hyggelig etter svaret, og negativ forsterkning styrker et svar ved å redusere eller fjerne noe ubehagelig. For eksempel gir et barn ros for å fullføre leksene sine positiv forsterkning, mens Å ta Aspirin for å redusere smerten av hodepine representerer negativ forsterkning. I begge tilfeller gjør forsterkningen det mer sannsynlig at atferd vil skje igjen i fremtiden.

Figur 8.5 Skinner Boks. B. F. Skinner brukte En Skinner boks for å studere operant læring. Boksen inneholder en bar eller nøkkel som organismen kan trykke for å motta mat og vann, og en enhet som registrerer organismens svar.

Tabell 8.1 Hvordan Positiv Og Negativ Forsterkning Og Straff Påvirker Atferd.
Operant betingelsesbetegnelse Beskrivelse Utfall Eksempel
Positiv forsterkning Legg til eller øk en hyggelig stimulans Atferden styrkes Å gi en student en premie etter at Han eller hun får En A på en test
Negativ forsterkning Reduser eller fjern en ubehagelig stimulus Atferden styrkes å Ta smertestillende midler som eliminerer smerte øker sannsynligheten for at du vil ta smertestillende igjen
Positiv straff Presenter eller legg til en ubehagelig stimulans Atferden er svekket Å Gi en student ekstra lekser etter at han eller hun har dårlig oppførsel i klassen
Negativ straff Reduser eller fjern en hyggelig stimulans Oppførselen er svekket Å Ta bort en tenårings datamaskin etter at han eller hun savner portforbud

Forsterkning, enten positiv eller negativ, virker ved å øke sannsynligheten for atferd. Straff, derimot, refererer til enhver hendelse som svekker eller reduserer sannsynligheten for en oppførsel. Positiv straff svekker et svar ved å presentere noe ubehagelig etter svaret, mens negativ straff svekker et svar ved å redusere eller fjerne noe hyggelig. Et barn som er jordet etter å ha slått med søsken (positiv straff) eller som mister muligheten til å gå til friminuttene etter å ha fått en dårlig karakter (negativ straff), er mindre sannsynlig å gjenta disse oppføringene.

selv om skillet mellom forsterkning (som øker atferden) og straff (som reduserer den) vanligvis er klart, er det i noen tilfeller vanskelig å avgjøre om en forsterker er positiv eller negativ. På en varm dag kan en kjølig bris bli sett på som en positiv forsterker (fordi den bringer inn kald luft) eller en negativ forsterker (fordi den fjerner varm luft). I andre tilfeller kan forsterkning være både positiv og negativ. Man kan røyke en sigarett både fordi det bringer glede (positiv forsterkning) og fordi det eliminerer suget etter nikotin (negativ forsterkning).

det er også viktig å merke seg at forsterkning og straff ikke bare er motsetninger. Bruken av positiv forsterkning i endring av atferd er nesten alltid mer effektiv enn å bruke straff. Dette skyldes at positiv forsterkning gjør at personen eller dyret føler seg bedre, og bidrar til å skape et positivt forhold til personen som gir forsterkningen. Typer av positiv forsterkning som er effektive i hverdagen inkluderer verbal ros eller godkjenning, tildeling av status eller prestisje og direkte økonomisk betaling. Straff, derimot, er mer sannsynlig å skape bare midlertidige endringer i atferd fordi den er basert på tvang og vanligvis skaper et negativt og motsatt forhold til personen som gir forsterkningen. Når personen som gir straffen forlater situasjonen, vil den uønskede oppførselen sannsynligvis komme tilbake.

Skape Kompleks Oppførsel Gjennom Operant Betinging

kanskje du husker å se en film eller være på et show der et dyr — kanskje en hund, en hest eller en delfin — gjorde noen ganske fantastiske ting. Treneren ga en kommando og delfinen svømte til bunnen av bassenget, plukket opp en ring på nesen, hoppet ut av vannet gjennom en bøyle i luften, dykket igjen til bunnen av bassenget, plukket opp en annen ring, og tok begge ringene til treneren ved kanten av bassenget. Dyret ble trent til å gjøre trikset, og prinsippene for operant betinging ble brukt til å trene den. Men disse komplekse atferd er langt fra de enkle stimulus-respons relasjoner som vi har vurdert så langt. Hvordan kan forsterkning brukes til å skape komplekse atferd som disse?

En måte å utvide bruken av operant læring er å endre tidsplanen som forsterkningen brukes på. Til dette punktet har vi bare diskutert en kontinuerlig forsterkningsplan, der ønsket respons forsterkes hver gang det oppstår; når hunden ruller over, for eksempel, blir det en kjeks. Kontinuerlig forsterkning resulterer i relativt rask læring, men også rask utryddelse av ønsket oppførsel når forsterkeren forsvinner. Problemet er at fordi organismen er vant til å motta forsterkningen etter hver oppførsel, kan responderen gi opp raskt når den ikke vises.

de fleste virkelige forsterkere er ikke kontinuerlige; de forekommer på en delvis (eller intermitterende) forsterkningsplan — en tidsplan der svarene noen ganger forsterkes og noen ganger ikke. I forhold til kontinuerlig forsterkning fører delvise forsterkningsplaner til langsommere innledende læring, men de fører også til større motstand mot utryddelse. Fordi forsterkningen ikke vises etter hver oppførsel, tar det lengre tid for eleven å bestemme at belønningen ikke lenger kommer, og dermed utryddelse er tregere. De fire typer partielle forsterkningsplaner er oppsummert I Tabell 8.2, » Forsterkningsplaner.»

Tabell 8.2 Forsterkningsplaner.
Forsterkning tidsplan Forklaring Virkelige eksempel
Fast-ratio Atferd forsterkes etter et bestemt antall svar. Fabrikkarbeidere som er betalt i henhold til antall produkter de produserer
Variabelforhold Atferd forsterkes etter et gjennomsnittlig, men uforutsigbart, antall svar. Utbetalinger fra spilleautomater og andre sjansespill
Fast intervall Atferd forsterkes for det første svaret etter at en bestemt tid har gått. Folk som tjener en månedslønn
Variabelt intervall Atferd forsterkes for det første svaret etter at en gjennomsnittlig, men uforutsigbar, tid har gått. Person som sjekker e-post for meldinger

Partielle forsterkningsplaner bestemmes av om forsterkningen presenteres på grunnlag av tiden som går mellom forsterkning (intervall) eller på grunnlag av antall responser som organismen engasjerer seg i (forhold), og om forsterkningen skjer på en vanlig (fast) eller uforutsigbar (variabel) tidsplan. I en fast intervallplan skjer forsterkning for det første svaret som er gjort etter at en bestemt tid har gått. For eksempel, på en ett-minutters fast intervall tidsplan dyret mottar en forsterkning hvert minutt, forutsatt at det engasjerer seg i atferden minst en gang i løpet av minuttet. Som Du kan se I Figur 8.6, «Eksempler På Responsmønstre Av Dyr Trent Under Forskjellige Delvise Forsterkningsplaner», har dyr under faste intervallplaner en tendens til å senke deres respons umiddelbart etter forsterkningen, men deretter øke oppførselen igjen når tiden for neste forsterkning kommer nærmere. (De fleste studenter studerer til eksamen på samme måte.) I en variabel-intervall tidsplan, forsterkerne vises på et intervall tidsplan, men timingen er variert rundt gjennomsnittlig intervall, noe som gjør det faktiske utseendet på forsterkeren uforutsigbar. Et eksempel kan være å sjekke e-posten din: du forsterkes ved å motta meldinger som kommer, i gjennomsnitt, si, hvert 30. minutt, men forsterkningen skjer bare ved tilfeldige tider. Intervallforsterkningsplaner har en tendens til å produsere sakte og jevn hastighet for å svare.

Figur 8.6 Eksempler På Responsmønstre Av Dyr Trent Under Forskjellige Delvise Forsterkningsplaner. Tidsplaner basert på antall svar (ratio typer) indusere større responsrate enn gjør tidsplaner basert på medgått tid (intervalltyper). Uforutsigbare tidsplaner (variable typer) gir også sterkere svar enn forutsigbare tidsplaner (faste typer).

i en fast forholdsplan forsterkes en oppførsel etter et bestemt antall svar. For eksempel kan en rottes oppførsel forsterkes etter at den har trykket en tast 20 ganger, eller en selger kan motta en bonus etter at han eller hun har solgt 10 produkter. Som du kan se i figur 8.6, «Eksempler På Responsmønstre Av Dyr Trent Under Forskjellige Delvise Forsterkningsplaner,» når organismen har lært å handle i samsvar med fastforholdsplanen, vil den bare pause kort når forsterkning skjer før den vender tilbake til et høyt nivå av respons. En variabel-ratio tidsplan gir forsterkere etter en bestemt, men gjennomsnittlig antall svar. Å vinne penger fra spilleautomater eller på en lotteri billett er et eksempel på forsterkning som skjer på en variabel forholdsplan. For eksempel, en spilleautomat (Se Figur 8.7,» Slot Machine») kan programmeres til a gi en seier hver 20 ganger brukeren trekker handtaket i gjennomsnitt. Ratio tidsplaner tendens til å produsere høy forekomst av å svare fordi forsterkning øker som antall svar øker.

Figur 8.7 Spilleautomat. Spilleautomater er eksempler på en variabel-ratio forsterkning tidsplan.

Komplekse atferd er også skapt gjennom forming, prosessen med å lede en organismes oppførsel til ønsket utfall gjennom bruk av suksessiv tilnærming til en endelig ønsket oppførsel. Skinner gjorde stor bruk av denne prosedyren i sine bokser. For eksempel kunne han trene en rotte til å trykke en bar to ganger for å motta mat, ved først å gi mat når dyret flyttet nær baren. Når denne oppførselen hadde blitt lært, Ville Skinner begynne å gi mat bare når rotten rørte baren. Videre forming begrenset forsterkningen til bare når rotten presset baren, til når den presset baren og rørte den en gang til, og til slutt til bare når den presset baren to ganger. Selv om det kan ta lang tid, kan operant betinging på denne måten skape kjeder av atferd som bare forsterkes når de er fullført.

Forsterkende dyr hvis de korrekt diskriminerer mellom lignende stimuli tillater forskere å teste dyrenes evne til å lære, og diskrimineringene de kan gjøre er noen ganger bemerkelsesverdige. Duer har blitt trent til å skille mellom Bilder Av Charlie Brown og De Andre Peanuts-tegnene (Cerella, 1980), og mellom forskjellige stilarter av musikk Og kunst (Porter & Neuringer, 1984; Watanabe, Sakamoto & Wakita, 1995).

Atferd kan også trenes gjennom bruk av sekundære forsterkere. Mens en primær forsterker inkluderer stimuli som naturlig foretrekkes eller nytes av organismen, for eksempel mat, vann og lindring fra smerte, er en sekundær forsterker (noen ganger kalt betinget forsterker) en nøytral hendelse som har blitt assosiert med en primær forsterker gjennom klassisk kondisjonering. Et eksempel på en sekundær forsterker ville være fløyten gitt av en dyretrener, som har blitt assosiert over tid med primærforsterkeren, mat. Et eksempel på en daglig sekundær forsterker er penger. Vi liker å ha penger, ikke så mye for stimulansen selv, men heller for de primære forsterkerne (de tingene pengene kan kjøpe) som det er knyttet til.

Viktige Takeaways

  • Edward Thorndike utviklet loven om effekt: prinsippet om at svar som skaper et typisk hyggelig utfall i en bestemt situasjon, er mer sannsynlig å forekomme igjen i en lignende situasjon, mens svar som gir et typisk ubehagelig utfall, er mindre sannsynlig å forekomme igjen i situasjonen.
  • B. F. Skinner utvidet Thorndikes ideer for å utvikle et sett med prinsipper for å forklare operant betinging.
  • Positiv forsterkning styrker en respons ved å presentere noe som vanligvis er behagelig etter responsen, mens negativ forsterkning styrker en respons ved å redusere eller fjerne noe som vanligvis er ubehagelig.
  • Positiv straff svekker et svar ved å presentere noe typisk ubehagelig etter svaret, mens negativ straff svekker et svar ved å redusere eller fjerne noe som vanligvis er hyggelig.
  • Forsterkning kan være enten delvis eller kontinuerlig. Partielle forsterkningsplaner bestemmes av om forsterkningen presenteres på grunnlag av tiden som går mellom forsterkninger (intervall) eller på grunnlag av antall responser som organismen engasjerer seg i (forhold), og om forsterkningen skjer på en vanlig (fast) eller uforutsigbar (variabel) tidsplan.
  • Komplekse atferd kan opprettes gjennom forming, prosessen med å lede en organismes oppførsel til ønsket utfall ved bruk av suksessiv tilnærming til en endelig ønsket oppførsel.

Øvelser Og Kritisk Tenkning

  1. Gi et eksempel fra dagliglivet til hver av følgende: positiv forsterkning, negativ forsterkning, positiv straff, negativ straff.
  2. Vurder forsterkningsteknikkene du kan bruke til å trene en hund til å fange Og hente En Frisbee som du kaster til den.
  3. Se følgende to videoer fra dagens tv-programmer. Kan du bestemme hvilke læringsprosedyrer som blir demonstrert?
    1. Kontoret: http://www.break.com/usercontent/2009/11/the-office-altoid-eksperiment-1499823
    2. Big Bang-Teorien : http://www.youtube.com/watch?v=JA96Fba-WHk

Cerella, J. (1980). Duenes analyse av bilder. Mønstergjenkjenning, 12, 1-6.

Thorndike, E. L. (1898). Animal intelligence: en eksperimentell studie av de assosiative prosessene hos dyr. Washington, DC: American Psychological Association (Engelsk).

Bilde Attribusjoner

Figur 8.6: Tilpasset Fra Kassin (2003).

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert.

More: