Het effectief inzetten van recruitment assessments vereist begrip van de wetenschappelijke principes die ten grondslag liggen aan deze instrumenten. Zonder deze basis bestaat het risico op assessments die weinig zeggen over daadwerkelijk functioneren of zelfs tot discriminatie kunnen leiden. Daarbij ontstaan vaak misverstanden over twee kernbegrippen: validiteit en betrouwbaarheid.
Deze begrippen worden regelmatig door elkaar gehaald, terwijl ze iets fundamenteel anders beschrijven. Een skilltest kan technisch goed in elkaar zitten, maar inhoudelijk weinig zeggen over werkprestatie. Andersom kan een test relevante vaardigheden proberen te meten, maar daar niet consequent in slagen. Dit artikel legt uit wat validiteit en betrouwbaarheid betekenen, hoe ze zich tot elkaar verhouden en waarom ze samen bepalend zijn voor de kwaliteit van selectie.
Validiteit verwijst naar de mate waarin een assessment daadwerkelijk meet wat het beoogt te meten. Er zijn verschillende vormen van validiteit:
Predictieve validiteit is de mate waarin de assessment-scores toekomstige werkprestaties voorspellen. Dit is de belangrijkste vorm van validiteit in recruitment context. Een assessment met hoge predictieve validiteit betekent dat kandidaten die hoog scoren, gemiddeld beter presteren in de functie dan kandidaten die laag scoren.
Inhoudsvaliditeit betreft de mate waarin de inhoud van het assessment representatief is voor de competenties die daadwerkelijk vereist zijn in de functie. Een programmeertest voor developers moet relevante programmeertalen en typische programmeeruitdagingen bevatten.
Constructvaliditeit gaat over de vraag of het assessment het onderliggende concept (het construct) goed meet. Meet een emotionele intelligentie-test daadwerkelijk EQ, of meet het in werkelijkheid vooral sociale wenselijkheid?
Betrouwbaarheid verwijst naar de consistentie van metingen. Een betrouwbaar assessment levert vergelijkbare resultaten op wanneer het herhaaldelijk wordt afgenomen onder vergelijkbare omstandigheden. Dit is essentieel voor eerlijke vergelijking tussen kandidaten.
Verschillende factoren beïnvloeden de betrouwbaarheid: de lengte van de test (langere tests zijn meestal betrouwbaarder), de duidelijkheid van instructies, en de standaardisatie van de afname-omstandigheden.
Het verschil tussen validiteit en betrouwbaarheid zit in wat je beoordeelt. Betrouwbaarheid gaat over de vraag of een skilltest consistent meet: levert dezelfde kandidaat onder vergelijkbare omstandigheden een vergelijkbare uitkomst op, en komen beoordelaars tot dezelfde score? Validiteit gaat over de vraag of de skilltest relevant en juist meet: toetst de test daadwerkelijk vaardigheden die samenhangen met succes in de functie?
Een praktische vuistregel is daarom:
Een test kan betrouwbaar zijn zonder valide te zijn, maar kan niet valide zijn zonder betrouwbaar te zijn.
Alleen betrouwbaarheid is niet genoeg. Een test kan technisch strak zijn (heldere scoring, stabiele scores) en toch weinig waarde hebben als de gemeten vaardigheden nauwelijks terugkomen in het werk. Dat leidt tot schijnobjectiviteit: de cijfers voelen overtuigend, maar zeggen inhoudelijk weinig over geschiktheid of werkprestatie.
Maar validiteit zonder betrouwbaarheid is ook problematisch. Een test kan inhoudelijk goed aansluiten op de rol, terwijl de uitvoering ruis introduceert. Denk aan open vragen zonder duidelijke beoordelingscriteria, grote verschillen tussen beoordelaars, of scores die sterk afhankelijk zijn van interpretatie. Dan wordt relevant gedrag wel geraakt, maar niet reproduceerbaar gemeten—waardoor beslissingen minder uitlegbaar en kwetsbaarder worden.
Bij Selection Lab komen betrouwbaarheid en validiteit samen in één gestandaardiseerde selectieflow. Skill tests worden niet los ingezet, maar geselecteerd en gecombineerd op basis van duidelijke kwaliteitscriteria. Het uitgangspunt daarbij is eenvoudig: tests moeten zowel inhoudelijk relevant zijn voor de rol als consistent en reproduceerbaar worden afgenomen.
Selection Lab werkt primair met wetenschappelijk gevalideerde assessments van externe leveranciers die voldoen aan strikte kwaliteitscriteria. Alleen instrumenten met aantoonbare psychometrische onderbouwing en relevante normgroepen worden opgenomen in het platform. Voorbeelden hiervan zijn Aivy, Bright, UCAT en Logiks (Talogy).
Bij persoonlijkheid, drijfveren en cultuur is de validiteit gebaseerd op erkende modellen zoals de Big Five Aspect Scales, Schwartz’ waardenmodel en het Groysberg-cultuurmodel. Voor hard skills ligt de focus op taakgerichte tests met oplopende moeilijkheid, zodat relevante functiecompetenties worden gemeten.
Daarnaast combineert Selection Lab meerdere valide componenten (zoals cognitieve vaardigheden, persoonlijkheid en hard skills) in één matchscore, waarbij wegingen kunnen worden afgestemd op de functie. In interne praktijkcases laat deze aanpak een duidelijke relatie zien tussen matchscore en hiringbeslissingen, wat wijst op voorspellende waarde.
Naast inhoudelijke validiteit is betrouwbaarheid bij Selection Lab geborgd door gestandaardiseerde afname en scoring. Kandidaten doorlopen korte, duidelijk gestructureerde modules met vaste instructies en oefenrondes. Scoring en normering zijn volledig geautomatiseerd, waardoor interpretatieverschillen worden geminimaliseerd.
Resultaten worden vergeleken met relevante normgroepen, waarbij scores worden uitgedrukt in genormeerde waarden (bijvoorbeeld 0–100). Deze normgroepen worden periodiek vernieuwd om vergelijkingen actueel en representatief te houden. Voor online afname kan optioneel proctoring worden ingezet (scherm, webcam en audio), wat de betrouwbaarheid verder vergroot bij kritische of hoog-risico selecties.
Ook op operationeel niveau worden maatregelen genomen om meetfouten te beperken, zoals eenmalige testlinks, aandachtchecks tegen slordige responsen en rechtstreekse server-to-server terugkoppeling van resultaten. Hierdoor worden
Skill tests zijn alleen waardevol wanneer ze zowel betrouwbaar als valide zijn. Betrouwbaarheid zorgt voor eerlijke en consistente meting, validiteit bepaalt of die meting daadwerkelijk iets zegt over succes in de functie. Het één zonder het ander leidt tot schijnzekerheid.
Organisaties die skill tests strategisch inzetten, investeren daarom niet alleen in tooling, maar ook in onderbouwing, standaardisatie en continue evaluatie. Pas dan worden skill tests wat ze moeten zijn: een stevig fundament onder betere, eerlijkere en beter uitlegbare hiringbeslissingen.
Of dien hier een terugbelverzoek in.