Positieve en
negatieve gedragsversterkers
Beide type versterkers dienen hetzelfde doel: gewenst gedrag laten
toenemen. Maar dat betekent niet dat ze dezelfde leerhouding bewerkstelligen:
de positieve gedragsversterker wil gedrag laten toenemen door de
hond iets te geven wat hij graag " hebben in ruil voor bepaald gedrag,
terwijl de negatieve gedragsversterking is gebaseerd op het verwijderen
van iets dat de hond onplezierig vindt omdat hij het gewenste gedrag vertoont.
Positieve gedragsversterking houdt in dat u alleen reageert op
gewenst gedrag en dat u niet gewenst gedrag totaal negeert.
Negatieve gedragsversterking heeft twee kanten:
-het toedienen/veroorzaken van een negatieve prikkel
-en het weghalen van een negatieve prikkel.
Daarmee bereikt men twee dingen: de kans op ongewenst gedrag neemt
af en ander (gewenst) gedrag neemt toe.Hoe je het ook draait of keert, de basis
van het leren bij gebruik van een negatieve gedragsversterker is het vermijden
van een onlustgevoel.
Deze traditionele manier van trainen - waarbij eerst een commando
en pas dan het te leren gedrag (geforceerd) komt - veroorzaakt bij de hond in
eerste instantie verwarring en het getoonde gedrag is voornamelijk gebaseerd op
vermijding. In de praktijk blijkt het gedrag slecht bestand tegen
uitdoving.Zeker wanneer (de dreiging van) de onaangename prikkel niet meer
aanwezig is. Daarom geven wij de voorkeur aan positieve gedragsversterkers.Ter
vergelijking: met de slipketting wordt een korte slag in de nek van de hond
gegeven (= een correctie). Dit is een onaangename prikkel die het trekken doet
ophouden. Daarna is de beweging van de arm of het rinkelende geluid dat de ruk
aan de slipketting voorspelt de negatieve gedragsversterker die zorgt dat de
hond niet meer trekt.
De hond kan de onaangename prikkel voorkomen door het gewenste gedrag
te vertonen. Zonder slipketting en zonder de dreiging van een correctie zal de
hond echter weer gaan trekken. Het gewenste gedrag is zeer gevoelig voor
uitdoving.
De clicker
voldoet aan alle voorwaarden
De clicker is dé geconditioneerde gedragsversterker bij uitstek,
omdat deze perfect voldoet aan de specifieke voorwaarden om gewenst gedrag heel
zuiver uit de rest van het gedrag te lichten om zo de hond heel duidelijk te
vertellen 'Dát gedrag gaatje wat opleveren'.
Alleen de clicker is altijd neutraal van geluid, het geluid is
snel en goed te timen bij het gewenste gedrag, het is hoorbaar over enige
afstand en het geluid van de clicker is - mits goed geconditioneerd en goed
gebruikt - een unieke voorbode van de primaire gedragsversterker, het lekkers.
Kies de
juiste beloning!
Lekkers gebruiken als beloning heeft vele voordelen. Behalve dat
de meeste honden het als een toppunt van beloning ervaren, is het ook snel te
geven, u kunt de smaak ervan variëren, u kunt grote of kleine brokjes geven, en
u kunt het op veel verschillende plaatsen bewaren tijdens de trainingssessie.
Een speeltje, een uitgebreide knuffel of een massage vragen meer
tijd, waardoor tijdens een leersessie minder effectief gebruik gemaakt kan
worden van de beschikbare tijd. Toch zult u dat moeten gebruiken als uw hond
dat veel belangrijker dan lekkers vindt.
Herders vinden een bal (aan een touwtje) vaak veel interessanter
dan een voertje, zachte honden hebben soms liever aandacht en een knuffel.
De ene hond wordt graag achter z'n oor gekriebeld, de ander vindt
het zalig zachtjes in zijn vel geknepen te worden. Het is heel belangrijk een
beloning te kiezen die voor uw hond echt waardevol is!
Gouden
spelregels
Enkele gouden spelregels voor een juist gebruik van de clicker:
-
een click = altijd lekkers.
-
Click nooit zonder lekkers te geven en geef tijdens de
trainingssessies nooit lekkers zonder te clicken!
-
De click betekent 'Ik heb
een afspraak met jou. Jij doet wat ik graag wil, dan doe ik wat jij graag
wilt'.
-
De click betekent 'Goed
gedaan, je liet zien wat ik wilde, kom je beloning maar halen'.
-
Dat is dan ook de vaste regel: na een click mag een hond zijn
gedrag afbreken en zijn beloning komen halen;-
-
werk aan één criterium tegelijk!Leer uw hond een bepaald criterium
van een oefening en leer hem pas als hij dat criterium beheerst een nieuw
criterium. Beheerst hij ook dat goed, dan pas voegt u ze samen!
Neem bijvoorbeeld de oefening'zit'. U wilt
een snelle zit, maar ook een zit recht voor of naast u.
Dan werkt u eerst aan de snelle zit, dan
aan een zit recht voor of naast u en als beide onderdelen bekend zijn, voegt u
ze samen en vraagt een snelle en rechte zit; - verhoog regelmatig uw norm en
pas een variabel versterkingsschema toe als de hond een bepaald niveau
beheerst.
Doet u dat niet, dan valt het gedrag weg;
uw hond gaat steeds minder presteren!;- stel de click uit, zoek het breekpunt
tussen de sterkste uitvoering van het gedrag en het wegvallen van het gedrag (=
extinctie, dit wordt verderop nog uitgelegd) en versterk dat moment; - click
nooit voor 'Ga door'.Het is absoluut niet de bedoeling om de clicker te
gebruiken als bruggetje tussen twee verschillende oefeningen.
De click betekent 'Goed gedaan, kom je
beloning maar halen'. Dus houd u aan die afspraak. Doet u dat niet, dan
ondermijnt u de kracht van de clicker.Een click is niet hetzelfde als een
'Braaf'of 'Goed zo'.
Die woorden kunt u wel als bruggetje
gebruiken om de hond aan te geven dat hij nog steeds op de juiste weg zit maar
nog niet klaar is.
Versterkings schema’s
Er zijn verschillende manieren om gedrag te laten toenemen en gedrag te laten
afnemen/verdwijnen.
Om bepaald gedrag aan te leren gebruiken
we constante positieve gedragsversterking (een click voor
een'zitbijvoorbeeld) en om het'mooier'en bestendig te maken gebruiken we variabele
gedragsversterking (een click voor twee zits, een click voor drie zits, een
click voor vier zits).
Variabele gedragsversterking wordt gebruikt
om gedrag volgens onze normen mooier te maken, (het shapen van een
oefening) dus sneller, of preciezer.En
vooral, om het minder gevoelig te maken voor uitdoving. Er zijn verschillende
mogelijkheden:- de click komt in een constante verhouding na een vast aantal
herhalingen van het gedrag. Dus in plaats van na elke uitvoering pas na elke
twee uitvoeringen.
Of na elke drie uitvoeringen;- de click
komt niet na een vast aantal herhalingen van het gedrag maar na een wisselend
aantal, bijvoorbeeld eerst na vijf, dan na twee, dan na acht, dan na tien. Dan
weer na één! Dat laatste is belangrijk om te voorkomen dat de hond besluit dat
het allemaal alleen maar moeilijker wordt en er de brui aan geeft.Bij constante
gedragsversterking geldt de gulden regel: u verhoogt de norm niet zolang uw
hond niet minstens 90 % succes bij het uitvoeren van een gevraagde opdracht
heeft.
Constante gedragsversterking wordt gebruikt
bij het aanleren van een oefening totdat de hond op een bepaald niveau
voldoende presteert. Dan gaat u over op een wisselend versterkingsschema om het
gedrag sterker te maken.
Door het uitstellen van uw click gaat de
hond 'overdreven' presteren, waardoor u uw norm kunt verhogen door voor de
mooiste uitvoering te clicken.
Vanaf dat moment is die mooiste uitvoering
de norm die u nu weer steeds clickt om hem te bestendigen en vervolgens weer
over te gaan op variabele gedragsversterking wanneer de hond de oefening
volgens die norm beheerst.
Let op: constante gedragsversterking wordt
ALTIJD gebruikt bij specifieke oefeningen. Bij het vinden van het juiste
voorwerp moet de hond weten dat dat het juiste voorwerp was.
Stelt u de click uit bij deze specifieke
oefening, dan mist de hond zijn informatie en zal hij op zoek gaan naar een
volgend voorwerp. Moet een hond leren om netjes recht voor u te gaan zitten, dan
heeft hij steeds een click nodig om te weten welke plek de juiste plek is.Het
gaat bij zulke oefeningen om de juiste informatie en heel veel herhalingen.
Varieer ook uw beloning!Er zijn meer
manieren om het gewenste gedrag te activeren:u varieert (ook) de beloning.
Lekkerder of meer. Het is echter wel belangrijk dat altijd alleen maar te
verbinden aan een betere uitvoering. U gebruikt het dus niet als motivatie om
beter gedrag te krijgen, u geeft het alleen als dat betere gedrag zich laat
zien! Geef het restant van het lekkers nooit aan het einde van een
trainingssessie 'Omdat hij toch zijn best gedaan heeft'of 'Omdat het morgen
niet meer vers is'.
Extinctie/uitdoving
Gedrag dat niet versterkt wordt
dooft uit. Dat heet extinctie.Continu versterkt gedrag is minder bestand
tegen uitdoving.Gedrag dat in principe bestand is tegen uitdoving kan echter
wel uitdoven, maar pas nadat de intensiteit van het gedrag is toegenomen.
Clickertraining heeft alles met dit fenomeen te maken. De hond verwacht een
click maar krijgt de click niet,en probeert meer en heviger.
Het uitstellen van de click laat het
gedrag dus toenemen. Tenzij u de click te lang uitstelt.Dan valt het gedrag
weg. De kunst bij het uitstellen van de click is nu nét dat breekpunt te
vinden. U clickt de toename van het gedrag en vanaf dat moment is dat de norm
van waaruit u weer verder werkt. En deze laatste uitvoering is dan weer nog
meer bestand tegen uitdoving! Het verhogen van de norm en een variabel
versterkingsschema is dus essentieel voor toename en betrouwbaarheid van het
gedrag.
Voorbeeld: uw hond bedelt en heeft altijd
succes. U besluit hem dat bedelen af te leren en negeert zijn smekende blik. Of
het tegen uw armen aanstoten met de voorpoten. Of de dwingende kop op
uw schoot. Uw hond weet echter dat succes verzekerd is. Het werkte immers altijd. Misschien let u niet
genoeg op, dus herhaalt hij zijn gedrag nadrukkelijker. En nog nadrukkelijker.
U heeft er genoeg van en geeft toe. Voor de
hond is dat de volgende norm: hij weet nu dat hij heviger en langer moet
aandringen om zijn zin te krijgen. Zou u het steeds volhouden om nooit meer op
zijn gebedel te reageren, dan zou dat gebeden echt ophouden te bestaan.
Geeft u echter één keer toch weer toe, al
is het na een maand, dan komt het gebedel in volle hevigheid weer terug.
Alleen: de hond vertoont het bedelgedrag nu heviger en langduriger dan ooit
tevoren.
De clicker overbodig maken
Uiteindelijk willen we van het gebruik van
de clicker af. Iedereen die met honden werkt,weet hoe moeilijk het is om
speeltjes, stemgeluidjes of handgebaartjes weg te trainen en vraagt zich dus
misschien af of dat met de clicker ook zo'n moeizaam gebeuren zal worden.
De clicker echter wijst slechts de weg op
een heel duidelijke manier. Als een hond weet wat hem te doen staat, is de
clicker daarbij niet meer nodig.
Nog sterker, het is op dat niveau van die
oefening volstrekt overbodig. Stel, u leert rekenen en leert dat 1 en 1 twee
is. U leert verder en leert tellen tot honderd. Als u dan een'Geweldig
gedaan'te horen krijgt voor een ondertussen'stomme'som als 1 plus 1, dan denkt
u toch dat uw leraar gek is geworden?
Let op: het gedrag dat wij onze hond
geleerd hebben en dat hij beheerst moet wel af en toe beloond (maar niet
geclickt!) worden om stand te houden, omdat er voor de hond weinig
zelfbelonends in dat gedrag besloten ligt.
Wij kiezen voor positieve gedragsversterking
Als we positieve en negatieve
gedragsversterkers en straf tegenover elkaar zetten, zullen we zien dat de
positieve gedragsversterker - mits er gebruik wordt gemaakt van interval-
versterking - de meeste kans geeft op krachtig voortbestaan van aangeleerd
gedrag:- u rijdt te hard. Er verschijnt een politieauto naast u (negatief signaal)
en de agent steekt vriendelijk een waarschuwende vinger op.
Als u verstandig bent, vermindert u uw
snelheid tot het aantal toegestane kilometers. Dit is een duidelijk voorbeeld
van een negatieve gedragsversterker: het gewenste gedrag (minder hard rijden)
neemt toe.
Tenzij u zeker weet dat er geen controle
aanwezig is, in dat geval rijdt u weer te hard; - zelfde situatie, alleen nu
waarschuwt de agent u niet meer, maar schrijft een bon uit. Dat is straf Want u
kunt de straf niet ontkomen door uw gedrag alsnog bij te stellen.U bent zeer
gefrustreerd. Heeft die bon op de lange termijn effect? Vermoedelijk niet.Zo
lang u weet dat de kans op een bekeuring behoorlijk groot is, zult u uw gedrag
vast wel aanpassen.
Op andere plaatsen vrijwel zeker niet; - u
krijgt nooit een bekeuring.
U krijgt aan het einde van het jaar als
bonus voor u goede gedrag een redelijk bedrag gestort.
U weet echter niet waarmee u dat precies
verdiend heeft: misschien omdat u nooit te hard reed, of omdat u nooit verkeerd
geparkeerd stond. Of omdat u nooit door rood licht bent gereden. Of omdat u
nooit betrapt bent. Welk gedrag is nu beloond, welk gedrag blijft nu in stand?
Vermoedelijk dat gedrag waarvan u denkt dat belangrijk voor die bonus was. Maar
of dat gedrag nu net bedoeld werd ... ?
Dit is wat een primaire
gedragsversterker/beloning doet. Het komt na het gedrag, de correlatie is
onduidelijk en is voor meer uitleg vatbaar;
U rijdt niet te hard en naast u verschijnt
een politieauto. De agent geeft u een waardebon, alleen het kortingsbedrag is
variabel. Als u genoeg van die bonnen hebt geeft dat een aanzienlijke korting
op uw wegenbelasting.
Naarmate u meer kans hebt om die bonnen te
verdienen (dit is een variabel versterkingsschema), zult u meer het gewenste
gedrag vertonen. Na verloop van tijd weet u niet meer beter; u heeft een nieuwe
gewoonte ontwikkeld.
Tenzij het slechts een korte actie was,
want dan zult u na die actie de buit binnenhalen en weer terug vallen in het
oude gedrag. U gaat weer te hard rijden. Dit is een pure vorm van een
geconditioneerde positieve gedragsversterking.
Het gewenste gedrag - je houden aan de
juiste snelheid - neemt toe, maar moet wel onderhouden worden door er af en toe
iets prettigs aan te verbinden. Let op: alleen in het laatste voorbeeld is aan
alle voorwaarden voldaan om gewenst gedrag dat bestendig is tegen uitdoving te
creëren.
Er is sprake van variabele
gedragsversterking (men weet niet van tevoren wanneer de agent verschijnt),
positieve gedragsversterking door een geconditioneerde gedragsversterker (de
kortingsbon) en een primaire beloning (geld).
Resumerend:
Bij clickertraining leert de hond het
verband tussen zijn gedrag en het gevolg daarvan begrijpen door het gebruik van
een geconditioneerde positieve gedragsver-sterker (de clicker). Shapen door
positieve gedragsversterking is de meest effectieve manier om uw hond bepaald
gedrag aan te leren. Door tijdens het shapingsproces het gedrag op een variabel
versterkingsschema te zetten, neemt de intensiteit van het gedrag toe en is het
bestand tegen uitdoving.
Marc Jaspers
[Eerste pagina] [Marc
Jaspers] [Sylvia
Hoving] [Herman
Peet]