Úvod do Psychologie – 1. Kanadské Vydání

Vzdělávací Cíle

  1. Nastínit principy operantního podmiňování.
  2. vysvětlete, jak lze učení formovat pomocí plánů výztuže a sekundárních výztuží.

v klasickém kondicionování se organismus učí spojovat nové podněty s přirozenými biologickými reakcemi, jako je slinění nebo strach. Organismus se nenaučí něco nového, ale spíše začne provádět stávající chování v přítomnosti nového signálu. Operantní podmiňování, na druhé straně je učení, které se vyskytuje na základě důsledků chování a mohou zahrnovat učení se nových opatření. Operantní podmiňování dochází, když se pes převalí na příkaz, protože to byl chválen pro to, aby v minulosti, když školní tyran ohrožuje své spolužáky, protože tím mu umožňuje získat jeho cestu, a když dítě dostane dobré známky, protože její rodiče vyhrožovat, trestat jí, jestli ona nemá. Při operativním kondicionování se organismus učí z důsledků svých vlastních činů.

Jak Zpevnění a Trest Ovlivnit Chování: Výzkum Thorndike a Skinner

Psycholog Edward L. Thorndike (1874-1949) byl prvním vědcem, aby systematicky studovat operantní podmiňování. Ve svém výzkumu Thorndike (1898) pozoroval kočky, které byly umístěny do „skládačky“, ze které se pokusily uniknout („Videoklip: Thorndike ‚ s Puzzle Box“). Na první kočky poškrábaný, trochu, a plácl nahodile, bez jakékoliv představy o tom, jak se dostat ven. Ale nakonec, a náhodou, stiskli páku, která otevřela dveře a vystoupila na jejich cenu, kus ryby. Příště byla kočka omezena v krabici, pokusila se méně neúčinných reakcí před provedením úspěšného útěku, a po několika pokusech se kočka naučila téměř okamžitě provést správnou odpověď.

Pozorování těchto změn u koček chování led Thorndike rozvíjet jeho zákon účinek, zásada, že odpovědi, které vytvářejí typicky příjemný výsledek v konkrétní situaci jsou více pravděpodobné, že se vyskytují znovu v podobné situaci, vzhledem k tomu, že reakce, které produkují typicky nepříjemný výsledek, je méně pravděpodobné, že dojde opět v situaci (Thorndike, 1911). Podstatou zákona účinku je, že úspěšné reakce, protože jsou příjemné, jsou“ vyraženy “ zkušenostmi, a tak se vyskytují častěji. Neúspěšné odpovědi, které vyvolávají nepříjemné zážitky, jsou „vyraženy“ a následně se vyskytují méně často.

když Thorndike umístil své kočky do skládačky, zjistil, že se po každém pokusu naučili zapojit se do důležitého únikového chování rychleji. Thorndike popsal učení, které následuje posílení z hlediska zákona účinku.

Hodinky: „Thorndike‘ s Puzzle Box“ : http://www.youtube.com/watch?v=BDujDOLre-8

vlivný behaviorální psycholog B. F. Skinner (1904-1990) rozšířen na Thorndike nápady rozvíjet více kompletní sadu zásad vysvětlit, operantní podmiňování. Skinner vytvořil speciálně navržená prostředí známá jako operantní komory (obvykle nazývané Skinner boxy), aby systematicky studoval učení. Skinner box (operant komora) je struktura, která je dostatečně velká, aby se vešly hlodavce nebo ptáka a který obsahuje bar nebo klíč, který organismus může stisknout nebo klovat k uvolnění potravin nebo vody. Obsahuje také zařízení pro zaznamenávání reakcí zvířete (obrázek 8.5).

nejzákladnější z Skinnerových experimentů byl docela podobný Thorndikeho výzkumu s kočkami. Krysa umístěna v komoře reagoval, jak by se dalo očekávat, pobíhá o box a čichání a škrábání na podlahu a stěny. Nakonec krysa narazila na páku, kterou stiskla, aby uvolnila pelety jídla. Příště, krysa trvala o něco méně času na stisknutí páky, a při následných pokusech, čas potřebný k stisknutí páky se zkrátil a zkrátil. Brzy krysa stiskla páku tak rychle, jak mohla jíst jídlo, které se objevilo. Jak předpovídal zákon účinku, krysa se naučila opakovat akci, která přinesla jídlo, a ukončit akce, které ne.

Skinner studoval v detailu, jak zvířata změnila své chování prostřednictvím posílení a trest, a on vyvinul pojmů, který vysvětluje procesy operantního učení (Tabulka 8.1, „Jak Pozitivní a Negativní Posilování a Trestání Ovlivnit Chování“). Skinner používá termín výstuž se odkazovat na jakékoli události, která posiluje nebo se zvyšuje pravděpodobnost, že chování, a termín punisher se odkazovat na jakékoli události, která oslabuje nebo snižuje pravděpodobnost, že chování. A použil výrazy pozitivní a negativní k označení toho, zda byla výztuž předložena nebo odstraněna. Pozitivní posílení tedy posiluje reakci tím, že po reakci představuje něco příjemného, a negativní posílení posiluje reakci snížením nebo odstraněním něčeho nepříjemného. Například dávat dítěti chválu za dokončení domácích úkolů představuje pozitivní posílení, zatímco užívání aspirinu ke snížení bolesti hlavy představuje negativní posílení. V obou případech posílení zvyšuje pravděpodobnost, že k chování dojde v budoucnu znovu.

Figura 8.5 Skinner Box. B. F. Skinner použil Skinnerovu krabici ke studiu operantního učení. Krabice obsahuje lištu nebo klíč, který organismus může stisknout pro příjem potravy a vody, a zařízení, které zaznamenává reakce organismu.
tabulka 8.1 Jak pozitivní a negativní posilování a tresty ovlivňují chování.
Operantní podmiňování pojem Popis Výsledek Příklad
Pozitivní posilování Přidat nebo zvýšit příjemnou stimulační Chování je posílena Dává studentovi cenu poté, co on nebo ona dostane A na testu
Negativní posílení Snížit nebo odstranit nepříjemný podnět Chování je posílena Užívat léky proti bolesti, které eliminují bolest se zvyšuje pravděpodobnost, že budete mít léky proti bolesti znovu
Pozitivní trest Dárek nebo přidat nepříjemný podnět Chování je oslabena Dát žákovi úkoly navíc, poté, co on nebo ona se chová špatně ve třídě
Negativní trest Snížení nebo odstranění příjemný stimul Chování je oslabena odnášet dospívající počítači poté, co on nebo ona postrádá zákaz vycházení

Výztuže, buď pozitivní, nebo negativní, působí tak, že zvyšuje pravděpodobnost, že chování. Trest, na druhou stranu, odkazuje na jakoukoli událost, která oslabuje nebo snižuje pravděpodobnost chování. Pozitivní trest oslabuje odpověď tím, že po odpovědi představí něco nepříjemného, zatímco negativní trest oslabuje odpověď snížením nebo odstraněním něčeho příjemného. Dítě, které je uzemněn po boji s sourozence (pozitivní trest), nebo kteří přijdou o možnost jít na přestávku po získání špatné grade (negativní trest), je méně pravděpodobné, že opakování těchto chování.

i když rozdíl mezi výztuže (což zvyšuje chování) a trest (což snižuje ji) je obvykle jasné, v některých případech je obtížné určit, zda reinforcer je pozitivní nebo negativní. V horkém dni chladný vánek lze považovat za pozitivní posilovač (protože přináší chladný vzduch) nebo negativní posilovač(protože odstraňuje horký vzduch). V ostatních případech může být výztuž pozitivní i negativní. Jeden může kouřit cigaretu jak proto, že přináší potěšení (pozitivní posílení), tak proto, že eliminuje touhu po nikotinu (negativní posílení).

je také důležité poznamenat, že posílení a trest nejsou jen protiklady. Použití pozitivního posílení při změně chování je téměř vždy účinnější než použití trestu. Je to proto, že pozitivní posilování je člověk nebo zvíře cítí lépe, pomáhá vytvářet pozitivní vztah s osobou, poskytující výztuže. Typy pozitivního posílení, které jsou účinné v každodenním životě, zahrnují slovní chválu nebo schválení, udělení statusu nebo prestiže a přímou finanční platbu. Trest, na druhé straně, je více pravděpodobné, že vytvořit pouze dočasné změny v chování, protože je založen na nátlaku a obvykle vytváří negativní a nepřátelský vztah s osobou poskytující výztuže. Když osoba, která poskytuje trest, opustí situaci, nežádoucí chování se pravděpodobně vrátí.

Vytvoření Komplexní Chování prostřednictvím Operantního Podmiňování

Možná si vzpomenete, sledování filmu nebo show, ve které zvíře — třeba pes, kůň, nebo delfín — udělal některé docela úžasné věci. Trenér dal příkaz a delfín plaval na dně bazénu, zvedl prsten na jeho nos, vyskočil z vody přes obruč ve vzduchu, vrhl se znovu na dno bazénu, zvedl další prsten, a pak vzal oba kroužky na trenéra, na okraji bazénu. Zvíře byl vycvičen trik, a na principy operantního podmiňování byly použity k vlaku. Ale tato složitá chování jsou daleko od jednoduchých vztahů stimulu a reakce, které jsme dosud zvažovali. Jak lze výztuž použít k vytvoření komplexního chování, jako je toto?

jedním ze způsobů, jak rozšířit použití operantního učení, je upravit plán, na který je výztuž aplikována. K tomuto bodu jsme diskutovali pouze o harmonogramu nepřetržitého zesílení, ve kterém je požadovaná odezva zesílena pokaždé, když k ní dojde; kdykoli se například pes převalí, dostane sušenku. Kontinuální výztuž má za následek relativně rychlé učení, ale také rychlé vyhynutí požadovaného chování, jakmile výztuž zmizí. Problém je v tom, že protože organismus je zvyklý přijímat výztuž po každém chování, respondent se může rychle vzdát, když se neobjeví.

většina výztuží v reálném světě není spojitá; vyskytují se na částečném (nebo přerušovaném) plánu výztuže — harmonogramu, ve kterém jsou reakce někdy zesíleny a někdy ne. Ve srovnání s kontinuální výztuží vedou plány částečné výztuže k pomalejšímu počátečnímu učení, ale také vedou k větší odolnosti vůči zániku. Protože se posílení neobjeví po každém chování, trvá déle, než student zjistí, že odměna již nepřichází, a proto je zánik pomalejší. Čtyři typy plánů částečného vyztužení jsou shrnuty v tabulce 8.2, “ plány výztuže.“

Tabulka 8.2 Plány Výztuže.
Výztuž plán Vysvětlení Real-svět příklad
Fixní poměr Chování je posílena až po určitém množství odpovědí. Tovární dělníky, kteří jsou placeni podle počtu produktů, které vyrábějí
Variabilní poměr Chování je posílena po průměrně, ale nepředvídatelné, počet odpovědí. Výhry z výherních automatů a dalších hazardních her
Fixní-interval Chování je posílena za první reakci po určité množství času uplynulo. Lidé, kteří vydělávají měsíční plat
Variabilní interval Chování je posílena za první reakci po průměrně, ale nepředvídatelné, množství času uplynulo. Člověk, který kontroluje e-mailové zprávy

Částečné vyztužení plány jsou stanoveny podle toho, zda výztuže je uveden na základě času, který uplyne mezi výztuže (interval), nebo na základě počtu odpovědí, které organismus zabývá (poměr), a tím, zda je výztuž dochází na pravidelné (pevné) nebo nepředvídatelné (proměnná) plán. V rozvrhu s pevným intervalem dochází k zesílení pro první odpověď provedenou po uplynutí určité doby. Například, v jednominutovém rozvrhu s pevným intervalem zvíře dostává každou minutu posílení, za předpokladu, že se chová alespoň jednou během minuty. Jak můžete vidět na Obrázku 8.6, „Příklady Vzorce chování u Zvířat Trénoval pod Různými Částečné Posílení Plány,“ zvířata v rámci fixní-interval plány mají tendenci zpomalit jejich reakce bezprostředně po posilování, ale pak se zvýší chování zase, jako další výztuž dostane blíž. (Většina studentů studuje na zkoušky stejným způsobem.) V proměnné interval plánu, reinforcers objeví na intervalu plán, ale načasování je pestrá kolem průměrný interval, takže skutečný vzhled výstuž nepředvídatelné. Příkladem může být kontrola vašeho e-mailu: ty jsou vyztuženy přijímání zpráv, které přicházejí, v průměru, řekněme, každých 30 minut, ale zpevnění se vyskytuje pouze v náhodných časech. Intervalové plány výztuže mají tendenci produkovat pomalé a stabilní rychlosti reakce.

obrázek 8.6 příklady vzorců odezvy u zvířat vyškolených podle různých plánů částečné výztuže. Plány založené na počtu odpovědí (typy poměru) indukují vyšší míru odezvy než plány založené na uplynulém čase(typy intervalů). Také nepředvídatelné plány (variabilní typy) produkují silnější reakce než předvídatelné plány (pevné typy).

v rozvrhu s pevným poměrem je chování zesíleno po určitém počtu odpovědí. Například chování krysy může být posíleno poté, co stisklo klávesu 20krát, nebo prodejce může získat bonus poté, co prodal 10 produktů. Jak můžete vidět na obrázku 8.6, „Příklady Vzorce chování u Zvířat Trénoval pod Různými Částečné Posílení Plány,“ jakmile organismus se naučil jednat v souladu s fixní poměr plánu, bude pauza jen krátce, když výztuže dochází před návratem na vysokou úroveň citlivosti. Plán s proměnným poměrem poskytuje posilovače po konkrétním, ale průměrném počtu odpovědí. Získání peněz z výherních automatů nebo na loterii je příkladem posílení, ke kterému dochází v plánu s proměnným poměrem. Například automat (viz Obrázek 8.7, „automat“) může být naprogramován tak, aby výhra každých 20 krát uživatel táhne rukojeť, v průměru. Poměr plány mají tendenci produkovat vysoké míry reagovat, protože výztuž se zvyšuje jak počet reakcí zvyšuje.

Figura 8.7 Automat. Hrací automaty jsou příklady harmonogramu výztuže s proměnným poměrem.

Komplexní chování jsou také vytvořeny přes formování, proces vedení organismu, chování na požadovaný výsledek pomocí postupných aproximací konečného požadovaného chování. Skinner tento postup ve svých krabicích rozsáhle využil. Například, mohl trénovat krysu, aby dvakrát stiskla bar, aby dostala jídlo, nejprve poskytnutím jídla, když se zvíře pohybovalo poblíž baru. Když se toto chování naučilo, Skinner začal poskytovat jídlo, až když se krysa dotkla baru. Další tvarování omezilo výztuž pouze na to, když krysa stiskla tyč, na to, když stiskla tyč a podruhé se jí dotkla, a nakonec pouze na to, když stiskla tyč dvakrát. I když to může trvat dlouho, tímto způsobem může operativní kondicionování vytvořit řetězce chování, které jsou posíleny pouze po dokončení.

posílení zvířat, pokud správně rozlišují mezi podobnými podněty, umožňuje vědcům testovat schopnost zvířat učit se a diskriminace, které mohou udělat, jsou někdy pozoruhodné. Holubi byli vyškoleni rozlišovat mezi obrazy Charlie Brown a jinými Arašídy znaky (Cerella, 1980), a mezi různými styly hudby a umění (Porter & Neuringer, 1984; Watanabe, Sakamoto & Wakita, 1995).

chování lze také trénovat pomocí sekundárních posilovačů. Vzhledem k tomu, že primární reinforcer obsahuje podněty, které jsou přirozeně přednost, nebo si užil v organismu, jako jsou potraviny, voda, a úlevu od bolesti, sekundární reinforcer (někdy nazývané stabilizovaným reinforcer) je neutrální události, které se staly spojené s primární reinforcer prostřednictvím klasického podmiňování. Příkladem sekundární reinforcer bude pískat dané zvíře trenér, který byl spojován v průběhu času s primární reinforcer, jídlo. Příkladem každodenního sekundárního posilovače jsou peníze. Baví nás mít peníze, ne tolik na samotný podnět, ale spíše na primární posilovače (věci, které si peníze mohou koupit), s nimiž jsou spojeny.

Klíčové Takeaways

  • Edward Thorndike vyvinutý zákon účinku: zásada, že odpovědi, které vytvářejí typicky příjemný výsledek v konkrétní situaci jsou více pravděpodobné, že se vyskytují znovu v podobné situaci, vzhledem k tomu, že reakce, které produkují typicky nepříjemný výsledek, je méně pravděpodobné, že se vyskytují znovu v situaci.
  • B. F. Skinner rozšířil na Thorndike myšlenky vytvořit soubor zásad, vysvětlit, operantní podmiňování.
  • pozitivní výztuž posiluje odpověď tím, že představuje něco, co je obvykle příjemné po odpovědi, zatímco negativní výztuž posiluje odpověď snížením nebo odstraněním něčeho, co je obvykle nepříjemné.
  • pozitivní trest oslabuje odpověď tím, že po odpovědi představuje něco typicky nepříjemného, zatímco negativní trest oslabuje odpověď snížením nebo odstraněním něčeho, co je obvykle příjemné.
  • výztuž může být buď částečná nebo spojitá. Částečné vyztužení plány jsou stanoveny podle toho, zda výztuže je uveden na základě času, který uplyne mezi posily (interval), nebo na základě počtu odpovědí, které organismus zabývá (poměr), a tím, zda je výztuž dochází na pravidelné (pevné) nebo nepředvídatelné (proměnná) plán.
  • komplexní chování může být vytvořeno tvarováním, procesem vedení chování organismu k požadovanému výsledku pomocí postupné aproximace ke konečnému požadovanému chování.

Cvičení a Kritické Myšlení

  1. Dát příklad z každodenního života každého z následujících: pozitivní posilování, negativní posilování, pozitivní trest, negativní trest.
  2. zvažte výztužné techniky, které můžete použít k výcviku psa, aby chytil a získal Frisbee, který mu hodíte.
  3. podívejte se na následující dvě videa z aktuálních televizních pořadů. Můžete určit, které vzdělávací postupy jsou demonstrovány?
    1. Kancelář: http://www.break.com/usercontent/2009/11/the-office-altoid- experiment-1499823
    2. Teorie Velkého Třesku : http://www.youtube.com/watch?v=JA96Fba-WHk

Cerella, J. (1980). Holubova analýza obrázků. Rozpoznávání Vzorů, 12, 1-6.

Thorndike, E. L. (1898). Inteligence zvířat: experimentální studie asociativních procesů u zvířat. Washington, DC: Americká psychologická asociace.

Atributy Obrázku

Obrázek 8.6: Adaptováno z Kassinu (2003).

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna.

More: