Positieve en negatieve gedragsversterkers

 

Beide type versterkers dienen hetzelfde doel: gewenst gedrag laten toenemen. Maar dat betekent niet dat ze dezelfde leerhouding bewerkstelligen:

de positieve gedragsversterker wil gedrag laten toenemen door de hond iets te geven wat hij graag " hebben in ruil voor bepaald gedrag, terwijl de negatieve gedragsversterking is gebaseerd op het verwijderen van iets dat de hond onplezierig vindt omdat hij het gewenste gedrag vertoont.

 

Positieve gedragsversterking houdt in dat u alleen reageert op gewenst gedrag en dat u niet gewenst gedrag totaal negeert.

 

Negatieve gedragsversterking heeft twee kanten:

-het toedienen/veroorzaken van een negatieve prikkel

-en het weghalen van een negatieve prikkel.

 

Daarmee bereikt men twee dingen: de kans op ongewenst gedrag neemt af en ander (gewenst) gedrag neemt toe.Hoe je het ook draait of keert, de basis van het leren bij gebruik van een negatieve gedragsversterker is het vermijden van een onlustgevoel.

 

Deze traditionele manier van trainen - waarbij eerst een commando en pas dan het te leren gedrag (geforceerd) komt - veroorzaakt bij de hond in eerste instantie verwarring en het getoonde gedrag is voornamelijk gebaseerd op vermijding. In de praktijk blijkt het gedrag slecht bestand tegen uitdoving.Zeker wanneer (de dreiging van) de onaangename prikkel niet meer aanwezig is. Daarom geven wij de voorkeur aan positieve gedragsversterkers.Ter vergelijking: met de slipketting wordt een korte slag in de nek van de hond gegeven (= een correctie). Dit is een onaangename prikkel die het trekken doet ophouden. Daarna is de beweging van de arm of het rinkelende geluid dat de ruk aan de slipketting voorspelt de negatieve gedragsversterker die zorgt dat de hond niet meer trekt.

De hond kan de onaangename prikkel voorkomen door het gewenste gedrag te vertonen. Zonder slipketting en zonder de dreiging van een correctie zal de hond echter weer gaan trekken. Het gewenste gedrag is zeer gevoelig voor uitdoving.

 

De clicker voldoet aan alle voorwaarden

 

De clicker is dé geconditioneerde gedragsversterker bij uitstek, omdat deze perfect voldoet aan de specifieke voorwaarden om gewenst gedrag heel zuiver uit de rest van het gedrag te lichten om zo de hond heel duidelijk te vertellen 'Dát gedrag gaatje wat opleveren'.

Alleen de clicker is altijd neutraal van geluid, het geluid is snel en goed te timen bij het gewenste gedrag, het is hoorbaar over enige afstand en het geluid van de clicker is - mits goed geconditioneerd en goed gebruikt - een unieke voorbode van de primaire gedragsversterker, het lekkers.

 

Kies de juiste beloning!

 

Lekkers gebruiken als beloning heeft vele voordelen. Behalve dat de meeste honden het als een toppunt van beloning ervaren, is het ook snel te geven, u kunt de smaak ervan variëren, u kunt grote of kleine brokjes geven, en u kunt het op veel verschillende plaatsen bewaren tijdens de trainingssessie.

Een speeltje, een uitgebreide knuffel of een massage vragen meer tijd, waardoor tijdens een leersessie minder effectief gebruik gemaakt kan worden van de beschikbare tijd. Toch zult u dat moeten gebruiken als uw hond dat veel belangrijker dan lekkers vindt.

Herders vinden een bal (aan een touwtje) vaak veel interessanter dan een voertje, zachte honden hebben soms liever aandacht en een knuffel.

De ene hond wordt graag achter z'n oor gekriebeld, de ander vindt het zalig zachtjes in zijn vel geknepen te worden. Het is heel belangrijk een beloning te kiezen die voor uw hond echt waardevol is!

 

Gouden spelregels

 

Enkele gouden spelregels voor een juist gebruik van de clicker:

-          een click = altijd lekkers.

-          Click nooit zonder lekkers te geven en geef tijdens de trainingssessies nooit lekkers zonder te clicken!

-           De click betekent 'Ik heb een afspraak met jou. Jij doet wat ik graag wil, dan doe ik wat jij graag wilt'.

-           De click betekent 'Goed gedaan, je liet zien wat ik wilde, kom je beloning maar halen'.

-          Dat is dan ook de vaste regel: na een click mag een hond zijn gedrag afbreken en zijn beloning komen halen;-

-          werk aan één criterium tegelijk!Leer uw hond een bepaald criterium van een oefening en leer hem pas als hij dat criterium beheerst een nieuw criterium. Beheerst hij ook dat goed, dan pas voegt u ze samen!

 

Neem bijvoorbeeld de oefening'zit'. U wilt een snelle zit, maar ook een zit recht voor of naast u.

Dan werkt u eerst aan de snelle zit, dan aan een zit recht voor of naast u en als beide onderdelen bekend zijn, voegt u ze samen en vraagt een snelle en rechte zit; - verhoog regelmatig uw norm en pas een variabel versterkingsschema toe als de hond een bepaald niveau beheerst.

Doet u dat niet, dan valt het gedrag weg; uw hond gaat steeds minder presteren!;- stel de click uit, zoek het breekpunt tussen de sterkste uitvoering van het gedrag en het wegvallen van het gedrag (= extinctie, dit wordt verderop nog uitgelegd) en versterk dat moment; - click nooit voor 'Ga door'.Het is absoluut niet de bedoeling om de clicker te gebruiken als bruggetje tussen twee verschillende oefeningen.

De click betekent 'Goed gedaan, kom je beloning maar halen'. Dus houd u aan die afspraak. Doet u dat niet, dan ondermijnt u de kracht van de clicker.Een click is niet hetzelfde als een 'Braaf'of 'Goed zo'.

Die woorden kunt u wel als bruggetje gebruiken om de hond aan te geven dat hij nog steeds op de juiste weg zit maar nog niet klaar is.

 

Versterkings schema’s

 

Er zijn verschillende manieren om   gedrag te laten toenemen en gedrag te laten afnemen/verdwijnen.

Om bepaald gedrag aan te leren gebruiken we constante positieve gedragsversterking (een click voor een'zitbijvoorbeeld) en om het'mooier'en bestendig te maken gebruiken we variabele gedragsversterking (een click voor twee zits, een click voor drie zits, een click voor vier zits).

 

Variabele gedragsversterking wordt gebruikt om gedrag volgens onze normen mooier te maken, (het shapen van een oefening)  dus sneller, of preciezer.En vooral, om het minder gevoelig te maken voor uitdoving. Er zijn verschillende mogelijkheden:- de click komt in een constante verhouding na een vast aantal herhalingen van het gedrag. Dus in plaats van na elke uitvoering pas na elke twee uitvoeringen.

Of na elke drie uitvoeringen;- de click komt niet na een vast aantal herhalingen van het gedrag maar na een wisselend aantal, bijvoorbeeld eerst na vijf, dan na twee, dan na acht, dan na tien. Dan weer na één! Dat laatste is belangrijk om te voorkomen dat de hond besluit dat het allemaal alleen maar moeilijker wordt en er de brui aan geeft.Bij constante gedragsversterking geldt de gulden regel: u verhoogt de norm niet zolang uw hond niet minstens 90 % succes bij het uitvoeren van een gevraagde opdracht heeft.

 

Constante gedragsversterking wordt gebruikt bij het aanleren van een oefening totdat de hond op een bepaald niveau voldoende presteert. Dan gaat u over op een wisselend versterkingsschema om het gedrag sterker te maken.

Door het uitstellen van uw click gaat de hond 'overdreven' presteren, waardoor u uw norm kunt verhogen door voor de mooiste uitvoering te clicken.

Vanaf dat moment is die mooiste uitvoering de norm die u nu weer steeds clickt om hem te bestendigen en vervolgens weer over te gaan op variabele gedragsversterking wanneer de hond de oefening volgens die norm beheerst.

 

Let op: constante gedragsversterking wordt ALTIJD gebruikt bij specifieke oefeningen. Bij het vinden van het juiste voorwerp moet de hond weten dat dat het juiste voorwerp was.

Stelt u de click uit bij deze specifieke oefening, dan mist de hond zijn informatie en zal hij op zoek gaan naar een volgend voorwerp. Moet een hond leren om netjes recht voor u te gaan zitten, dan heeft hij steeds een click nodig om te weten welke plek de juiste plek is.Het gaat bij zulke oefeningen om de juiste informatie en heel veel herhalingen.

Varieer ook uw beloning!Er zijn meer manieren om het gewenste gedrag te activeren:u varieert (ook) de beloning. Lekkerder of meer. Het is echter wel belangrijk dat altijd alleen maar te verbinden aan een betere uitvoering. U gebruikt het dus niet als motivatie om beter gedrag te krijgen, u geeft het alleen als dat betere gedrag zich laat zien! Geef het restant van het lekkers nooit aan het einde van een trainingssessie 'Omdat hij toch zijn best gedaan heeft'of 'Omdat het morgen niet meer vers is'.

 

Extinctie/uitdoving

 

Gedrag dat niet versterkt wordt dooft uit. Dat heet extinctie.Continu versterkt gedrag is minder bestand tegen uitdoving.Gedrag dat in principe bestand is tegen uitdoving kan echter wel uitdoven, maar pas nadat de intensiteit van het gedrag is toegenomen. Clickertraining heeft alles met dit fenomeen te maken. De hond verwacht een click maar krijgt de click niet,en probeert meer en heviger.

Het uitstellen van de click laat het gedrag dus toenemen. Tenzij u de click te lang uitstelt.Dan valt het gedrag weg. De kunst bij het uitstellen van de click is nu nét dat breekpunt te vinden. U clickt de toename van het gedrag en vanaf dat moment is dat de norm van waaruit u weer verder werkt. En deze laatste uitvoering is dan weer nog meer bestand tegen uitdoving! Het verhogen van de norm en een variabel versterkingsschema is dus essentieel voor toename en betrouwbaarheid van het gedrag.

 

Voorbeeld: uw hond bedelt en heeft altijd succes. U besluit hem dat bedelen af te leren en negeert zijn smekende blik. Of het tegen uw armen aanstoten met de voorpoten. Of de          dwingende kop op uw schoot. Uw hond weet echter dat succes verzekerd is. Het werkte          immers altijd. Misschien let u niet genoeg op, dus herhaalt hij zijn gedrag nadrukkelijker. En nog nadrukkelijker.

U heeft er genoeg van en geeft toe. Voor de hond is dat de volgende norm: hij weet nu dat hij heviger en langer moet aandringen om zijn zin te krijgen. Zou u het steeds volhouden om nooit meer op zijn gebedel te reageren, dan zou dat gebeden echt          ophouden te bestaan.

Geeft u echter één keer toch weer toe, al is het na een maand, dan komt het gebedel in volle hevigheid weer terug. Alleen: de hond vertoont het bedelgedrag nu heviger en langduriger dan ooit tevoren.

 

De clicker overbodig maken

 

Uiteindelijk willen we van het gebruik van de clicker af. Iedereen die met honden werkt,weet hoe moeilijk het is om speeltjes, stemgeluidjes of handgebaartjes weg te trainen en vraagt zich dus misschien af of dat met de clicker ook zo'n moeizaam gebeuren zal worden.

De clicker echter wijst slechts de weg op een heel duidelijke manier. Als een hond weet wat hem te doen staat, is de clicker daarbij niet meer nodig.

Nog sterker, het is op dat niveau van die oefening volstrekt overbodig. Stel, u leert rekenen en leert dat 1 en 1 twee is. U leert verder en leert tellen tot honderd. Als u dan een'Geweldig gedaan'te horen krijgt voor een ondertussen'stomme'som als 1 plus 1, dan denkt u toch dat uw leraar gek is geworden?

 

Let op: het gedrag dat wij onze hond geleerd hebben en dat hij beheerst moet wel af en toe beloond (maar niet geclickt!) worden om stand te houden, omdat er voor de hond weinig zelfbelonends in dat gedrag besloten ligt.

 

Wij kiezen voor positieve gedragsversterking

 

Als we positieve en negatieve gedragsversterkers en straf tegenover elkaar zetten, zullen we zien dat de positieve gedragsversterker - mits er gebruik wordt gemaakt van interval- versterking - de meeste kans geeft op krachtig voortbestaan van aangeleerd gedrag:- u rijdt te hard. Er verschijnt een politieauto naast u (negatief signaal) en de agent steekt vriendelijk een waarschuwende vinger op.

Als u verstandig bent, vermindert u uw snelheid tot het aantal toegestane kilometers. Dit is een duidelijk voorbeeld van een negatieve gedragsversterker: het gewenste gedrag (minder hard rijden) neemt toe.

Tenzij u zeker weet dat er geen controle aanwezig is, in dat geval rijdt u weer te hard; - zelfde situatie, alleen nu waarschuwt de agent u niet meer, maar schrijft een bon uit. Dat is straf Want u kunt de straf niet ontkomen door uw gedrag alsnog bij te stellen.U bent zeer gefrustreerd. Heeft die bon op de lange termijn effect? Vermoedelijk niet.Zo lang u weet dat de kans op een bekeuring behoorlijk groot is, zult u uw gedrag vast wel aanpassen.

Op andere plaatsen vrijwel zeker niet; - u krijgt nooit een bekeuring.

 

U krijgt aan het einde van het jaar als bonus voor u goede gedrag een redelijk bedrag gestort.

U weet echter niet waarmee u dat precies verdiend heeft: misschien omdat u nooit te hard reed, of omdat u nooit verkeerd geparkeerd stond. Of omdat u nooit door rood licht bent gereden. Of omdat u nooit betrapt bent. Welk gedrag is nu beloond, welk gedrag blijft nu in stand? Vermoedelijk dat gedrag waarvan u denkt dat belangrijk voor die bonus was. Maar of dat gedrag nu net bedoeld werd ... ?

Dit is wat een primaire gedragsversterker/beloning doet. Het komt na het gedrag, de correlatie is onduidelijk en is voor meer uitleg vatbaar;

 

U rijdt niet te hard en naast u verschijnt een politieauto. De agent geeft u een waardebon, alleen het kortingsbedrag is variabel. Als u genoeg van die bonnen hebt geeft dat een aanzienlijke korting op uw wegenbelasting.

Naarmate u meer kans hebt om die bonnen te verdienen (dit is een variabel versterkingsschema), zult u meer het gewenste gedrag vertonen. Na verloop van tijd weet u niet meer beter; u heeft een nieuwe gewoonte ontwikkeld.

Tenzij het slechts een korte actie was, want dan zult u na die actie de buit binnenhalen en weer terug vallen in het oude gedrag. U gaat weer te hard rijden. Dit is een pure vorm van een geconditioneerde positieve gedragsversterking.

Het gewenste gedrag - je houden aan de juiste snelheid - neemt toe, maar moet wel onderhouden worden door er af en toe iets prettigs aan te verbinden. Let op: alleen in het laatste voorbeeld is aan alle voorwaarden voldaan om gewenst gedrag dat bestendig is tegen uitdoving te creëren.

Er is sprake van variabele gedragsversterking (men weet niet van tevoren wanneer de agent verschijnt), positieve gedragsversterking door een geconditioneerde gedragsversterker (de kortingsbon) en een primaire beloning (geld).

 

Resumerend:

 

Bij clickertraining leert de hond het verband tussen zijn gedrag en het gevolg daarvan begrijpen door het gebruik van een geconditioneerde positieve gedragsver-sterker (de clicker). Shapen door positieve gedragsversterking is de meest effectieve manier om uw hond bepaald gedrag aan te leren. Door tijdens het shapingsproces het gedrag op een variabel versterkingsschema te zetten, neemt de intensiteit van het gedrag toe en is het bestand tegen uitdoving.
Marc Jaspers

 

[Eerste pagina] [Marc Jaspers] [Sylvia Hoving]  [Herman Peet]