Artikelen, Beoordelingsproblemen, Systeemissues

Sorry, de goede beoordelingen waren op

In veel organisaties speelt de kromme van Gauss een rol bij de beoordelingen. Leidinggevenden voelen zich op de vingers gekeken, medewerker voelen zich te kort gedaan. Hoger management en HR zijn tevreden (netjes volgens de curve) of ontevreden over hun leidinggevenden (ze durven geen onvoldoendes te geven).

Sorry, de goede oordelen waren op.

Leidinggevenden die gedwongen worden om conform de kromme van Gauss te beoordelen kunnen in de verleiding gebracht worden om zich daarachter te verschuilen. “Volgend jaar ben jij weer aan de beurt voor een goede beoordeling”. Dit gaat ten koste van de geloofwaardigheid van het instrument. Nog erger is het als leidinggevenden (achteraf) overruled worden door het hoger management.

Een ander risico van een gedwongen toepassing van de curve  is dat het concurrentie tussen medewerkers stimuleert. Scoren ten opzichte van, of zelfs ten koste van collega’s loont, teamwork loont minder.

De gevolgen voor medewerkers als er gevolgen voor de beloning aan het oordeel vastzitten kunnen aanzienlijk zijn.

 

Zelfoverschatting: oordelen vallen dus  tegen en demotiverenTekstblokje Kromme van Gauss

We (medewerkers) hebben de neiging zichzelf te overschatten (self enhancement theory). We overschatten onze bijdrage in groepen ook.  Mensen die een positieve beoordeling krijgen ervaren dat de beoordeling accurater is en zijn er meer tevreden over. Dat betekent dat oordelen per definitie lager uitkomen dan verwacht.

Die Gauss kromme komt dus al helemaal niet overeen met de verwachtingen van de medewerkers. Je krijgt daardoor een situatie waarbij iedereen ongelukkig wordt. De leidinggevende wordt ongelukkig want hij wil zijn medewerkers niet teleurstellen.

Als medewerkers beschikken over heldere afspraken en weten dat dat de grondslag is voor het oordeel kunnen ze een betere inschatting maken van wat het oordeel zal worden. Gesprekken kunnen dan ook meer kunnen gaan over ontwikkeling en de toekomst dan over het oordeel. Dat is motiverender.

Inflatie van oordelen door de keuze van kwalificaties.

Leidinggevenden geven liever een goed dan een voldoende. Voldoende voelt vaak aan als matig.  De vraag is hoe we voldoende en goed definiëren. Ik werk voor klanten waar het voldoen aan de afspraak of de norm gedefinieerd is als “voldoende”. Daar worden vaak “goed” oordelen gegeven, want een voldoende voelt niet positief.  Bij andere opdrachtgevers is het voldoen aan de norm gedefinieerd is als “goed”. Medewerkers die  net onder de maat functioneren krijgen te horen dat ze een “voldoende” krijgen.  In het gesprek zeggen leidinggevenden dan: “Ik beoordeel dit met een voldoende…..en dat is niet goed”. Ik werk graag met kwalificaties die in het gewone spraakgebruik geen andere betekenis hebben en dus minder ruis opleveren. Weinigen pakken de definities erbij in de praktijk.

Wat betekent het oordeel?

Bij beoordelingen en het gesprek over Gauss gaat het al snel over of een medewerker excellent, zeer goed of (on-)voldoende is. Maar hoe stel je vast of iemand goed is? Een jarenlang goed functionerende medewerker met een dipje is waarschijnlijk nog steeds goed, maar heeft wel een dipje. Als je probeert te beoordelen of iemand goed is verval je al snel in beoordelingsfouten.Tekstblokje beoordelingsfouten

Om de beoordeling te objectiveren maken we aan het begin van het jaar meetbare prestatie- en of ontwikkelingsafspraken. Na het jaar wordt de balans opgemaakt en worden de afspraken vergeleken met de prestatie. Maar ook hier liggen beoordelingsfouten op de loer:

  • de omstandigheden meewegen. Hoe kun je die omstandigheden wegen? De ene medewerker klaagt over de tegenwind de andere nauwelijks.
  • niet alleen kijken naar het afgesproken resultaat, maar ook de wijze waarop deze bereikt zijn mee-beoordelen.

Als je het oordeel terugbrengt tot bijna een mathematische oefening in het vergelijken van afspraak met de prestatie objectiveer je het wel. Maar dan zegt de uitkomst van de (niet passende) Gauss verdeling niet alleen iets over de prestaties, maar ook iets over het ambitieniveau van de afspraken. Met andere woorden: ambitieuze doelen leiden tot slechtere oordelen. Deze oordelen gaan meer zeggen over hoe goed de medewerker is, als de afspraken de functie in de breedte afdekken (en niet alleen verbeterafspraken zijn, specials) en realistisch zijn. Dat vraagt om bij veranderende omstandigheden de afspraken bij te stellen. Met andere woorden de tussentijdse gesprekken over de voortgang en het realisme van de afspraken worden hierdoor in de beoordelingscyclus ook veel belangrijker.

Als je uitgaat van heldere afspraken en daarop fair beoordeelt, dan kan hoger management niet meer overrulen. Ze kunnen hoogstens iets vinden van het ambitieniveau van de afspraken.

 

 

Weg met de kromme dan?

We hebben gezien dat er neigingen zijn om door een roze bril te kijken en te positief te oordelen. We hebben ook gezien dat medewerkers dan meer vertrouwen hebben in de beoordeling en dat negatieve oordelen demotiverend zijn. Maar wat gebeurt er met de te positief beoordeelden? In de grafiek het roze gedeelte.

Roze gauss

Deze mensen beschouwen zich als top, terwijl ze het niet zijn. Zij verwachten de mooie projecten, of een bevordering. Dat blijft uit, verwachtingen zijn gewekt en demotivatie dreigt.  Bovendien wordt minder goed functionerende medewerkers  zo de kans ontnomen om zich te verbeteren. Bij een dreigend ontslag hebben we een dossier waarmee we ons zelf  in de voet schieten.

 

Oplossingen

  • Beoordeel op heldere criteria. Hou verzachtende omstandigheden buiten de oordelen. Stel de afspraken bij gedurende het jaar, indien nodig.
  • Gebruik de kromme van Gauss alleen bij grote getallen en niet dwingend. Onderzoek de afwijkingen van de oordelen ten opzichte van kromme, maar ook ten opzichte van de prestaties van organisatie of het organisatie onderdeel.  Een slecht functionerend organisatie-onderdeel met excellerende medewerkers vraagt nader onderzoek. Er kunnen vele oorzaken zijn: te ambitieuze doelen, tegenwind in de sector, kwalificaties die niet helpen, beperkte beoordelingsvaardigheden van leidinggevenden.
  • Stem oordelen tussen beoordelaars onderling af. Bij voorkeur bij beoordelaars die leiding geven aan dezelfde functies. In een dergelijke “rapportenvergadering” bevragen leidinggevenden elkaar op hun voorgenomen oordelen en vergelijken gemaakte afspraken, Dit kalibreren zorgt voor consistentie van scoring over verschillende afdelingen / departementen en goed voorbereide leidinggevenden.

About the author

No Comments

  • Ger Klinkenberg July 20, 2017 at 11:44

    Je verhaal gaat mank. Nergens in het hele verhaal houd je rekening met het effect van selectie en selectieve verbetering.

    Personeel beoordelen gebeurt met het doel om te selecteren en te verbeteren. De Gauss kromme geldt alleen voor een onafhankelijk normaal verdeelde populatie. Het personeel bestand is niet onafhankelijk normaal verdeeld. Dit is zeker niet het geval na selectie aan de poort, jarenlange selectie door beoordeling en uitvoeren van verbeterplannen,.

    Van de slechtst beoordeelden is na verloop van tijd afscheid genomen, de iets minder functionerende medewerkers hebben een verbetertraject doorlopen. Als na 5 jaar van selectie en door-ontwikkelen, een personeelspopulatie nog voldoet aan een onafhankelijk normaal verdeelde populatie is, dan moet je nadenken of je meetinstrument (lees Leidinggevende en HR) wel geschikt is voor zijn taak. Alleen als je mensen ineens op iets beoordeelt, waarop niet geselecteerd is (bijvoorbeeld lengte van personeel; als lengte geen criterium bij aanname is) zal daar weer een normaal verdeelde symmetrische Gauss curve uitkomen.

    In je hele verhaal ga je ervan uit dat leidinggevende een feitelijk aanwezige symmetrische verdeling door een roze bril verprutsen. De verdeling van de kwaliteit van het personeelbestand zal echter na verloop van tijd asymmetrisch worden. De asymmetrie zal net andersom liggen dan de curve van jouw roze bril curve. Immers de minst functionerende groep is afgevallen en de groep daarnet boven is verbeterd. Daardoor snijd je de “mindere” zijde van de curve weg. Als goed gemeten en geselecteerd is moet dat er ook bij een herhaalde meting zo uitkomen.

    Vraag is of de hele “Pseudowetenschap” die van beoordelen gemaakt wordt, wel geschikt is om dat te doen waarvoor deze bedoeld is? Als we ervan uitgaan dat medewerkers graag goed in hun vel zitten, maar dat er soms iemand bijzit die niet voldoet is daar deze kerstboom niet voor nodig. Een bedrijf heeft meer baat bij een leidinggevende die mensen weet te stimuleren dan aan een leidinggevende die kan afrekenen.

    • Jan Jacob de Groot July 20, 2017 at 12:26

      Beste Ger,

      Hartelijk dank voor je uitgebreide en interessante reactie. Laat ik beginnen met je slotzin: Een bedrijf heeft meer baat bij een leidinggevende die mensen weet te stimuleren dan aan een leidinggevende die kan afrekenen. Ik kan me daarin vinden, waarbij afrekenen (de term suggereert helaas iets negatiefs) ook heel stimulerend kan werken. Wat mij betreft heeft een beoordeling als doel te zorgen dat medewerkers bijdragen aan de doelen van de organisatie, zich kunnen ontwikkelen en daarmee inzetbaar blijven en om te stimuleren. Het is én, en, niet of of.

      Je statistische benadering (niets mis mee), suggereert dat ik een voorstander ben van een dwingende toepassing van de curve. Dat ben ik niet. Het gaat er wat mij betreft niet om of medewerkers goed zijn (als een absoluut gegeven), maar of zij hun afspraken realiseren. Het enige wat dan overblijft van de werkelijke curve is dat het je helpt bij het onderzoek naar de kwaliteit van je beoordelingen: is het juist dat onze mensen bijvoorbeeld zo positief scoren, en hoe komt het dan dat we het als organisatieonderdeel niet goed gedaan hebben? In het eerste voetbalelftal zitten onze beste spelers. Ze scoren zeer goed of excellent, als het team meer presteert dan verwacht, maar als ze gewoon doen wat ze moeten doen dan scoren ze gemiddeld. Binnen het team kunnen ook onderlinge verschillen bestaan. Ik pleit er niet voor om te curve hierop toe te passen, maar iedereen zeer goed te beoordelen, terwijl ze degraderen, dat is op zijn minst een vraag voor onderzoek.

      Je schrijft: “De verdeling van de kwaliteit van het personeelbestand zal echter na verloop van tijd asymmetrisch worden. ….. Immers de minst functionerende groep is afgevallen en de groep daarnet boven is verbeterd. Daardoor snijd je de “mindere” zijde van de curve weg.” De vraag is ten opzichte van wat de groep het beter is gaan doen. Als medewerkers zich ontwikkelen, meer senior worden, betaal je ze vaak meer omdat je meer van ze mag verwachten. Kortom de verwachting (de gemaakte afspraken) gaat omhoog en ten opzichte van die verwachting is het nog maar de vraag of mensen beter worden. Medewerkers begrijpen vaak niet waarom ze niet steeds betere oordelen krijgen, ze ontwikkelen immers? Dat is precies de reden waarom je niet moet beoordelen zonder heldere verwachtingen.

      Ik denk dat onze opvattingen dichter bij elkaar liggen dan het lijkt, maar dat onze verschillen van visie neerkomen op dat jij de curve benadert als een weergave van hoe goed medewerkers (absoluut) zijn, ik relateer het steeds aan de verwachting, de afspraak. Ik zou niet weten hoe je anders zou moeten beoordelen. Ten opzichte van wat?, dat is de vraag.