Hur förstärkningsscheman fungerar

Operantkonditionering är en inlärningsprocess där nya beteenden förvärvas och modifieras genom deras associering med konsekvenser. Att förstärka ett beteende ökar sannolikheten för att det kommer att inträffa igen i framtiden medan straff för ett beteende minskar sannolikheten för att det kommer att upprepas.

Vid operant konditionering är förstärkningsplaner en viktig del av inlärningsprocessen. När och hur ofta vi förstärker ett beteende kan det ha en dramatisk inverkan på svarets styrka och hastighet.

Schema för förstärkning

Ett schema för förstärkning är i grunden en regel som anger vilka fall av beteende som kommer att förstärkas. I vissa fall kan ett beteende förstärkas varje gång det inträffar. Ibland kan ett beteende inte förstärkas alls.

Antingen positiv förstärkning eller negativ förstärkning kan användas som en del av operativ konditionering. I båda fallen är målet med förstärkning att stärka ett beteende så att det sannolikt kommer att inträffa igen.

Förstärkningsscheman sker både i naturligt förekommande inlärningssituationer och i mer strukturerade träningssituationer. I verkliga miljöer kommer beteenden förmodligen inte att förstärkas varje gång de inträffar. I situationer där du medvetet försöker förstärka en specifik åtgärd (som i skolan, idrott eller i djurträning) skulle du följa ett specifikt förstärkningsschema.

Vissa scheman passar bättre för vissa typer av träningssituationer. I vissa fall kan träning kräva ett schema och sedan byta till ett annat när önskat beteende har lärt sig.

Typer av förstärkningsscheman

De två grundläggande formerna av armeringsscheman kallas kontinuerlig armering och partiell armering.

Kontinuerlig förstärkning

Vid kontinuerlig förstärkning förstärks det önskade beteendet varje gång det inträffar. Detta schema används bäst under de inledande faserna av inlärningen för att skapa en stark koppling mellan beteende och respons.

Tänk dig till exempel att du försöker lära en hund att skaka hand. Under de första inlärningsstadierna skulle du hålla fast vid ett kontinuerligt förstärkningsschema för att lära ut och fastställa beteendet. Det kan handla om att ta tag i hundens tass, skaka den, säga "skaka" och sedan erbjuda en belöning varje gång du utför dessa steg. Så småningom kommer hunden att utföra åtgärden på egen hand.

Kontinuerliga förstärkningsplaner är mest effektiva när man försöker lära ut ett nytt beteende. Det betecknar ett mönster som varje snävt definierat svar följs av en snävt definierad konsekvens.

Delvis förstärkning

När svaret väl är fastställt byter vanligtvis ett kontinuerligt förstärkningsschema till ett partiellt förstärkningsschema. I partiell (eller intermittent) förstärkning förstärks svaret endast en del av tiden. Lärda beteenden förvärvas långsammare med partiell förstärkning, men svaret är mer motståndskraftigt mot utrotning.

Tänk på det tidigare exemplet där du tränade en hund för att skaka och. Medan du ursprungligen använde kontinuerlig förstärkning är det helt enkelt orealistiskt att förstärka beteendet varje gång. Med tiden skulle du byta till ett partiellt schema för att ge ytterligare förstärkning när beteendet har fastställts eller efter att lång tid har gått.

Det finns fyra scheman för partiell förstärkning:

Scheman med fast förhållande

Scheman med fast förhållande är de där ett svar förstärks först efter ett angivet antal svar. Detta schema ger en hög, jämn svarstakt med bara en kort paus efter förstärkarens leverans. Ett exempel på ett schema med fast förhållande skulle vara att leverera en matpellet till en råtta efter att den har tryckt en stapel fem gånger.

Scheman för variabelt förhållande

Scheman med variabelt förhållande inträffar när ett svar förstärks efter ett oförutsägbart antal svar. Detta schema skapar en hög jämn svarstakt. Spel och lotterispel är bra exempel på en belöning baserad på ett schema med variabelt förhållande. I en laboratorieinställning kan detta innebära att du levererar matpellets till en råtta efter en stångpress, igen efter fyra stångpressar och sedan igen efter två stångpressar.

Schema för fasta intervall

Scheman med fast intervall är de där det första svaret belönas först efter att en viss tid har gått. Detta schema orsakar stora mängder svarande i slutet av intervallet men långsammare svarar direkt efter leveransen av förstärkaren. Ett exempel på detta i en laboratorieinställning skulle vara att förstärka en råtta med en labpellet för den första stångpressen efter ett intervall på 30 sekunder.

Schema för variabelt intervall

Scheman med variabelt intervall inträffar när ett svar belönas efter en oförutsägbar tid. Detta schema ger en långsam, stadig svarsfrekvens.

Ett exempel på detta skulle vara att leverera en matpellet till en råtta efter den första stångpressen efter ett minuts intervall; en andra pellet för det första svaret efter ett intervall på fem minuter; och en tredje pellet för det första svaret efter ett intervall på tre minuter.

Använd lämpligt schema

Att bestämma när man ska förstärka ett beteende kan bero på ett antal faktorer. I fall där du specifikt försöker lära ut ett nytt beteende är ett kontinuerligt schema ofta ett bra val. När beteendet har lärt sig är det ofta att föredra att byta till ett partiellt schema.

I det dagliga livet förekommer partiella förstärkningsplaner mycket oftare än kontinuerliga. Tänk dig till exempel om du fick en belöning varje gång du dök upp för att arbeta i tid. Med tiden, istället för att belöningen är en positiv förstärkning, kan förnekandet av belöningen betraktas som negativ förstärkning.

Istället delas belöningar som dessa ut på ett mycket mindre förutsägbart partiellt förstärkningsschema. Inte bara är dessa mycket mer realistiska, men de tenderar också att producera högre svarsfrekvenser samtidigt som de är mindre mottagliga för utrotning.

Delvisa scheman minskar risken för mättnad när ett beteende har fastställts. Om en belöning ges utan slut kan ämnet sluta utföra beteendet om belöningen inte längre önskas eller behövs.

Föreställ dig till exempel att du försöker lära en hund att sitta. Om du använder mat som belöning varje gång kan hunden sluta prestera när den är full. I sådana fall kan något som beröm eller uppmärksamhet vara mer effektivt för att förstärka ett redan etablerat beteende.

Ett ord från Verywell

Operativ konditionering kan vara ett kraftfullt inlärningsverktyg. Schemat för förstärkning som används under tränings- och underhållsprocessen kan ha stor inverkan på hur snabbt ett beteende förvärvas, styrkan i svaret och hur ofta beteendet visas.

För att avgöra vilket schema som är att föredra måste du överväga olika aspekter av situationen, inklusive vilken typ av beteende som lärs ut och vilken typ av svar som önskas.