Managers, u mag 10% van uw medewerkers als  “uitstekend” beoordelen, 40%  als “boven verwachting”, 40%  als “”volgens verwachting”,  en 10%  “ onder verwachting”. Deze segmentering staat bekend als “stacked ranking” or “forced bell curve ranking.”

Microsoft was een van de vele grote bedrijven die deze methode gebruikte om haar medewerkers te classificeren naar hun functioneren. Microsoft is daarmee op 12 november 2013 gestopt en heeft deze methode een mislukking genoemd precies op het moment dat Yahoo, onder leiding van Marissa Mayer het is gaan omarmen. Marissa MayerMicrosoft hoopt dat door afschaffing er beter zal worden samengewerkt. Dit systeem werd afgeschaft omdat het zou leiden tot een focus op de kortetermijndoelen, en niet op de langetermijninnovatie, schrijft The Washington Post. Werknemers zouden namelijk vooral bezig zijn met politieke spelletjes en vrienden maken. Uit onderzoek van   Institute for Corporate Productivity (i4cp), zou in 2009 nog 49% van de bedrijven stacked ranking systemen gebruiken, tegen nog maar 14% in 2011. Peter Cohan (Forbes) schrijft over het systeem van stack ranking  dat het het verkeerde gedrag beloont. Het stimuleert medewerkers om bij managers in een goed daglicht te komen door steeds te vertellen over hun successen. De verliezers in dit systeem zijn de bescheiden medewerkers die ervan uit gaan dat hun successen wel voor zichzelf zullen spreken.  Goede wijn behoeft geen krans.

Bij Yahoo ontstaan veel protesten tegen het daar genoemde systeem van “Quarterly Performance Review”. Leidinggevenden worden gedwongen medewerkers negatief te beoordelen, zelfs als ze niet slecht functioneren.  Er zouden inmiddels 600 medewerkers op basis hiervan zijn ontslagen.

Als leidinggevenden normaal gesproken goed  beoordelen dan zou er iets van een normaal verdeling moeten ontstaan (Gauss kromme): sommige medewerkers doen het beter dan anderen, terwijl de meesten functioneren op een vergelijkbaar niveau. Als deze normaal verdeling niet ontstaat dan vraagt dit om onderzoek. Een verklaring zou kunnen zijn dat er inderdaad een extreem afwijkende groep medewerkers is. Meer waarschijnlijk is dat leidinggevenden niet hun verantwoordelijkheid nemen en beoordelen met een roze bril. Dit staat bekend als het Leniency, of soepelheidseffect, één van de vele beoordelingsfouten.  

Ik kom in mijn praktijk veel misverstanden, dan wel onhandig gebruik van ranking en Gauss krommes tegen.

De basis van het beoordelen.

Stel een nieuwe medewerker treedt toe tot een team van collegae’s met een vergelijkbaar niveau. Deze nieuwe medewerker ontwikkelt zich als een komeet, maar functioneert nog niet op het niveau van de collega’s. Hoe beoordeel je deze medewerker?

Vergelijk je deze medewerker met de collega’s dan is deze medewerker minder goed, maar vergelijk je deze medewerker met een ‘normale’ ontwikkelingslijn dan is deze medewerker mogelijk excellent.

Als je beoordeelt dan zegt elke kwalificatie veel over de basis van het oordeel. Een uitstekende medewerker zegt mij niets: de vraag is ten opzichte van wat of wie. En we hebben niet altijd grote groepen vergelijkbare medewerkers.

“Je oordelen zijn te positief en moeten worden bijgesteld”.

Sommige directies vragen soms de voorgenomen oordelen op, zetten die in een curve en komen tot de conclusie dat er veel te positief beoordeeld wordt. Vervolgens krijgen leidinggevenden de opdracht om de oordelen naar beneden bij te stellen. Alsof daarmee het probleem is opgelost. Leidinggevenden laten zich tijdens het beoordelingsgesprek ontvallen: ”Ik had je graag een zeer goed gegeven, maar ik had er al te veel. Volgend jaar doe ik mijn best voor jou”. Ik adviseer te investeren in heldere verwachtingen, heldere afspraken aan het begin van het jaar. Deze afspraken kunnen gekalibreerd worden, en getoetst aan de visie en het beleid en getoetst op perverse prikkels en realisme. Naarmate deze afspraken beter zijn zal het beoordelingsproces transparanter worden. Een positieve kromme is dan alleen mogelijk als de afdeling of eenheid het ook beter heeft gedaan dan verwacht.

De omvang van de populatie.

Om statistisch met ranking of normaal verdelingen  te kunnen werken is er een populatie nodig die vaak groter is dan de span of control van de leidinggevende. Met andere woorden: hoe statistisch zinnig is het ranken en het doorrekenen van de verdeling?

Angst voor ontslag als je slecht gerankt wordt.

Disfunctionerende medewerkers zouden zich in elk systeem zorgen moeten maken.  In ons ontslagrecht  is er meer nodig dan een slechte ranking of een slechte beoordeling: zoals een bewezen disfunctioneren, dat meerdere keren besproken is en waarbij een verbetertraject is voorgesteld. Dus een slechte ranking kan nooit het enige zijn, waarop medewerkers ontslagen worden.

Afspraken als uitgangspunt voor de beoordeling.

Ik geloof dat enige concurrentie binnen organisaties best kan werken en ook dat goede feedback op wat goed gaat en wat niet individuen verder brengt.  Ik geloof dat heldere afspraken een beter uitgangspunt zijn voor de beoordeling. Deze afspraken moeten aansluiten bij de strategie van de organisatie, en bij het individu. Het heeft meer zin om aan het begin van het jaar de afspraken scherp tegen het licht te houden en te kalibreren, dan achteraf beoordelingen bij te stellen. Het jaar is dan al voorbij.