Operantkonditionering, ibland kallad instrumental conditioning, är en metod för inlärning som använder belöningar och straff för beteende. Genom operant konditionering skapas en koppling mellan ett beteende och en konsekvens (oavsett om det är negativt eller positivt) för det beteendet.
Till exempel, när labråttor trycker på en spak när ett grönt ljus tänds, får de en matpellet som belöning. När de trycker på spaken när ett rött ljus tänds får de en mild elektrisk stöt. Som ett resultat lär de sig att trycka på spaken när det gröna ljuset lyser och undvika det röda ljuset.
Men operant konditionering är inte bara något som äger rum i experimentella miljöer under träning av laboratoriedjur. Det spelar också en stark roll i det dagliga lärandet. Förstärkning och bestraffning sker i naturliga miljöer hela tiden, liksom i mer strukturerade miljöer som klassrum eller terapisessioner.
Historien om operatörskonditionering
Operativ konditionering beskrevs först av beteendevetaren BF Skinner, varför man ibland kan höra att den kallas Skinnerian-konditionering. Som beteendevänare ansåg Skinner att det inte verkligen var nödvändigt att titta på interna tankar och motivationer för att förklara beteende . Istället föreslog han att vi bara skulle titta på de yttre, observerbara orsakerna till mänskligt beteende.
Genom den första delen av 1900-talet blev behaviorism en viktig kraft inom psykologin. John B. Watsons idéer dominerade tidigt denna tankeskola. Watson fokuserade på principerna för klassisk konditionering, en gång berömde han att han kunde ta vilken person som helst oavsett deras bakgrund och träna dem till att vara allt han valde.
Tidiga behaviorister fokuserade sina intressen på associativt lärande. Skinner var mer intresserad av hur konsekvenser av människors handlingar påverkade deras beteende.
Skinner använde termen operant att hänvisa till alla "aktiva beteenden som påverkar miljön för att generera konsekvenser." Skinners teori förklarade hur vi förvärvar utbudet av inlärda beteenden vi uppvisar varje dag.
Hans teori påverkades starkt av psykologens arbete, Edward Thorndike, som hade föreslagit vad han kallade effektlagen. Enligt denna princip är det mer sannolikt att åtgärder som följs av önskvärda resultat upprepas medan de följs av oönskade resultat är mindre benägna att upprepas.
Operatörskonditionering bygger på en ganska enkel förutsättning: Åtgärder som följs av förstärkning kommer att stärkas och mer sannolikt att inträffa igen i framtiden. Om du berättar en rolig historia i klassen och alla skrattar, är det troligt att du kommer att berätta den historien igen i framtiden.
Om du lyfter handen för att ställa en fråga och din lärare berömmer ditt artiga beteende, är det mer troligt att du lyfter handen nästa gång du har en fråga eller kommentar. Eftersom beteendet följdes av förstärkning eller ett önskvärt resultat stärks den föregående åtgärden.
Omvänt kommer handlingar som leder till bestraffning eller oönskade konsekvenser försvagas och mindre sannolikt kommer att inträffa igen i framtiden. Om du berättar samma historia igen i en annan klass men ingen skrattar den här gången är det mindre troligt att du upprepar historien igen i framtiden. Om du ropar ut ett svar i klassen och din lärare skäller ut dig, är det kanske mindre troligt att du avbryter klassen igen.
Typer av beteenden
Skinner skilde mellan två olika typer av beteenden
- Respondentbeteenden är de som uppstår automatiskt och reflexivt, som att dra tillbaka handen från en het spis eller ryck i benet när läkaren knackar på knäet. Du behöver inte lära dig dessa beteenden. De inträffar helt enkelt automatiskt och ofrivilligt.
- Operatörsbeteendenå andra sidan är de under vår medvetna kontroll. Vissa kan ske spontant och andra medvetet, men det är konsekvenserna av dessa handlingar som sedan påverkar huruvida de inträffar igen i framtiden. Våra åtgärder mot miljön och konsekvenserna av den åtgärden utgör en viktig del av inlärningsprocessen.
Medan klassisk konditionering kunde svara för respondenternas beteende insåg Skinner att det inte kunde redogöra för mycket lärande. Istället föreslog Skinner att operantkonditionering hade mycket större betydelse.
Skinner uppfann olika apparater under sin pojkårstid och han lade dessa färdigheter till jobbet under sina studier om operant konditionering. Han skapade en anordning som kallas en operant konditioneringskammare, ofta kallad en Skinner-låda idag. Kammaren kunde rymma ett litet djur, som en råtta eller duva. Lådan innehöll också en stapel eller nyckel som djuret kunde trycka på för att få en belöning.
För att spåra svar utvecklade Skinner också en enhet som kallas en kumulativ inspelare. Enheten registrerade svar som en uppåtgående rörelse av en linje så att svarsfrekvenser kunde läsas genom att titta på linjens lutning.
Komponenter för operatörskonditionering
Det finns flera nyckelbegrepp inom operant konditionering.
Förstärkning i operatörskonditionering
Förstärkning är varje händelse som stärker eller ökar beteendet som följer. Det finns två typer av förstärkare. I båda dessa fall av förstärkning ökar beteendet.
- Positiva förstärkare är gynnsamma händelser eller resultat som presenteras efter beteendet. I positiva förstärkningssituationer förstärks ett svar eller beteende genom att beröm eller direkt belöning läggs till. Om du gör ett bra jobb på jobbet och din chef ger dig en bonus är den bonusen en positiv förstärkare.
- Negativa förstärkare involvera avlägsnande av ogynnsamma händelser eller resultat efter att ett beteende har visats. I dessa situationer förstärks ett svar genom att ta bort något som anses obehagligt. Till exempel, om ditt barn börjar skrika mitt i en restaurang, men slutar när du ger dem en godis, ledde din handling till att det obehagliga tillståndet avlägsnades, vilket förstärkte ditt beteende (inte ditt barns) negativt.
Straff i operatörskonditionering
Bestraffning är en presentation av en ogynnsam händelse eller ett resultat som orsakar en minskning av beteendet som följer. Det finns två typer av straff. I båda dessa fall minskar beteendet.
- Positivt straff, som ibland kallas straff genom ansökan, utgör en ogynnsam händelse eller ett resultat för att försvaga svaret som följer. Spanking för dåligt beteende är ett exempel på bestraffning genom ansökan.
- Negativt straff, även känd som straff genom borttagning, inträffar när en gynnsam händelse eller utfall tas bort efter att ett beteende inträffar. Att ta bort ett barns videospel efter dåligt beteende är ett exempel på negativt straff.
Förstärkningsscheman
Förstärkning är inte nödvändigtvis en okomplicerad process, och det finns ett antal faktorer som kan påverka hur snabbt och hur väl nya saker lärs in. Skinner fann det när och hur ofta beteenden förstärktes spelade en roll i förvärvets hastighet och styrka. Med andra ord påverkade tidpunkten och frekvensen av förstärkning hur nya beteenden lärde sig och hur gamla beteenden modifierades.
Skinner identifierade flera olika förstärkningsscheman som påverkar den operativa konditioneringsprocessen:
- Kontinuerlig förstärkning innebär att man levererar en förstärkning varje gång ett svar inträffar. Inlärning tenderar att ske relativt snabbt, men svarsfrekvensen är ganska låg. Utrotning sker också mycket snabbt när förstärkningen har stoppats.
- Scheman med fast förhållande är en typ av partiell förstärkning. Svaren förstärks först efter att ett specifikt antal svar har inträffat. Detta leder vanligtvis till en relativt stabil svarsfrekvens.
- Scheman med fast intervall är en annan form av partiell förstärkning. Förstärkning sker först efter att ett visst tidsintervall har gått. Svarsfrekvensen förblir ganska stabil och börjar öka när förstärkningstiden närmar sig, men saktar omedelbart efter att förstärkningen har levererats.
- Scheman med variabelt förhållande är också en typ av partiell förstärkning som involverar förstärkande beteende efter ett varierat antal svar. Detta leder till både hög svarsfrekvens och långsam utrotningsgrad.
- Scheman med variabelt intervall är den sista formen av partiell förstärkning som Skinner beskrev. Detta schema innebär att leverera förstärkning efter att en varierande tid har gått. Detta tenderar också att leda till en snabb svarsfrekvens och långsam utrotningsgrad.
Exempel på operatörskonditionering
Vi kan hitta exempel på operantkonditionering på jobbet runt omkring oss. Tänk på att barn har gjort läxor för att tjäna en belöning från en förälder eller lärare eller anställda som avslutar projekt för att få beröm eller kampanjer. Fler exempel på operant konditionering i aktion inkluderar:
- Efter att ha spelat i en teaterföreställning får du applåder från publiken. Detta fungerar som en positiv förstärkareoch inspirerar dig att testa fler prestationsroller.
- Du tränar din hund att hämta genom att ge honom beröm och ett klapp på huvudet när han utför sitt beteende korrekt. Det här är en annan positiv förstärkare.
- En professor berättar för studenterna att om de har perfekt närvaro hela terminen, behöver de inte ta den slutliga omfattande tentamen. Genom att ta bort en obehaglig stimulans (det sista testet) gör eleverna det negativt förstärkt att delta i lektionen regelbundet.
- Om du misslyckas med att lämna in ett projekt i tid blir din chef arg och skämmer bort din prestation framför dina medarbetare. Detta fungerar som en positiv straffarevilket gör det mindre troligt att du kommer att avsluta projekt sent i framtiden.
- En tonårstjej städar inte sitt rum som hon blev ombedd, så hennes föräldrar tar bort telefonen för resten av dagen. Detta är ett exempel på en negativt straff där en positiv stimulans tas bort.
I några av dessa exempel orsakar löftet eller möjligheten till belöning en ökning av beteendet. Operatörskonditionering kan också användas för att minska ett beteende via avlägsnande av ett önskvärt resultat eller tillämpning av ett negativt resultat. Till exempel kan ett barn få höra att de kommer att förlora fördjupningsprivilegier om de pratar ur sin tur i klassen. Denna potential för straff kan leda till en minskning av störande beteenden.
Ett ord från Verywell
Även om behaviorism kan ha förlorat mycket av den dominans som hölls under den tidiga delen av 1900-talet, är operantkonditionering fortfarande ett viktigt och ofta använt verktyg i inlärnings- och beteendemodifieringsprocessen. Ibland leder naturliga konsekvenser till förändringar i vårt beteende. I andra fall kan belöningar och straff medvetet delas ut för att skapa en förändring.
Operatörskonditionering är något du omedelbart kan känna igen i ditt eget liv, oavsett om det handlar om att lära dina barn bra uppförande eller att träna familjens hund. Kom ihåg att alla typer av lärande tar tid. Tänk på vilken typ av förstärkning eller bestraffning som kan fungera bäst för din unika situation och bedöm vilken typ av förstärkningsschema som kan leda till bästa resultat.