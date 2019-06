Beeld Marcel van den Bergh/Hollandse Hoogte

Kinderen worden in Nederland al op 11- of 12-jarige leeftijd geselecteerd voor het voortgezet onderwijs. Op basis van het schooladvies wordt de keuze gemaakt voor vwo, havo, of vmbo en daarmee ligt dat schooladvies aan de basis van een beslissing die de levens van ­Nederlandse kinderen bepaalt.

Het schooladvies moet degelijk en eerlijk zijn en de overheid dient daarvoor zorg te dragen. De uitspraken die minister Slob vorige week in Het Parool deed zijn daarom reden tot grote zorg.

Volgens Slob kan de gestandaardiseerde ­eindtoets een kleinere rol spelen, omdat het schooladvies ‘professionele keuzes en goede inschattingen’ reflecteert. Een eeuw psychologisch en onderwijskundig onderzoek heeft ­echter ondubbelzinnig uitgewezen dat het menselijk oordeel juist gewantrouwd moet worden. Bij ingewikkelde beslissingen op basis van onvolledige informatie vallen mensen ­terug op kennis die zij menen te hebben over de wereld.

Link

In het geval van het oordeel over leerlingen is die kennis vaak georganiseerd in stereotypen die niet kloppen: meisjes zijn niet goed in ­wiskunde, wie voor een dubbeltje geboren is zal nooit een kwartje worden. Het menselijk ­oordeel wordt zo gemakkelijk vertekend, met structurele bias tot gevolg.

Het recente rapport van het CBS toont bijvoorbeeld ondubbelzinnig aan dat het oordeel van leerkrachten gemiddeld genomen lager is voor meisjes dan voor jongens, ook al hebben ze dezelfde testscore. Het is belangrijk om op te merken dat hier geen kwade wil in het spel hoeft te zijn: vertekeningen in het menselijk oordeel vinden onder andere plaats door automatische informatieverwerking die onbewust plaatsvindt: dat is precies wat het menselijk oordeel zo link maakt.

Het vertrouwen dat Slob uitspreekt in het menselijk oordeel is gevaarlijk naïef.

In Nederland wordt het menselijk oordeel om deze reden geflankeerd door een objectievere maat, namelijk een testscore. Het idee hierachter is dat testscores minder gevoelig zijn voor stereotypen, omdat het toetsingsproces gestandaardiseerd en dus voor iedereen hetzelfde is.

Uit onderzoek blijkt inderdaad dat de hoeveelheid bias in testscores over het algemeen kleiner is dan die in het menselijk oordeel (hoewel ook toetsen doorgaans niet volledig eerlijk zijn). Dit betekent niet dat het menselijk oordeel irrelevant is, en wij zijn net als de meeste andere psychometrici van mening dat men het menselijk oordeel en de testscore moet combineren.

Dat laat onverlet dat het gebruik van een gestandaardiseerde test met het oog op eerlijkheid en transparantie een essentieel onderdeel van de selectieprocedure is.

Tijdrovende klus

Tenminste, als voor alle leerlingen dezelfde toets gebruikt wordt. Dat is in Nederland sinds enkele jaren niet meer het geval. Waar ­oorspronkelijk één eindtoets gebruikt werd (namelijk die van het Cito) zijn er momenteel meerdere aanbieders van toetsen op de markt. Deze aanbieders volgen verschillende methoden, gebruiken verschillende opgaven en baseren zich op verschillende modellen en scoringsregels.

Volgens Slob is dit niet erg, want ‘scholen waarderen de keuze tussen verschillende toetsen; die variatie past ook bij het Nederlandse onderwijssysteem’.

Ook dit is gevaarlijk naïef. De scores van leerlingen op verschillende toetsen zijn niet zonder meer vergelijkbaar. Met andere woorden: we weten niet hoe een score van 220 op de toets van Route 8 zich verhoudt tot een score van 540 op de Citotoets. Als men zulke scores al vergelijkbaar kan maken is dat een bijzonder complexe en tijdrovende klus.

Huidige statistische en psychometrische methoden die scores uit verschillende toetsen vergelijkbaar moeten maken zijn gebaseerd op zeer sterke aannames over de meeteigenschappen van de toetsen en de schaaleigenschappen van de gemeten vaardigheden. De validiteit van die aannames is moeilijk na te gaan en dat betekent dat de eerlijkheid van de selectieprocedure niet goed is vast te stellen.

Slob denkt dat het allemaal niet zo’n probleem is. ‘Het College voor Toetsen en Examens wordt de toezichthouder van alle toetsen en moet ervoor zorgen dat ze onderling goed te vergelijken zijn.’ Alweer naïef. Als men de verschillende scores al vergelijkbaar kan maken, dan is dat een ingewikkelde en tijdrovende klus die eigenlijk alleen te begrijpen is door psychometrische experts.

Hoe complex en weinig transparant de methodologie is, bleek enkele weken geleden wel, toen naar buiten kwam dat door een rekenfout aan zo’n 20.000 achtstegroepers verkeerde uitslagen waren verstrekt.

De fout was blijkbaar iedereen ontgaan en kwam alleen aan het licht doordat leerkrachten en ouders opviel dat de adviezen in sommige groepen consequent te hoog waren. Als de fout niet systematisch was geweest maar willekeurige leerlingen had getroffen, was hij wellicht nooit opgemerkt. Het College voor Toetsen en Examens had hem in ieder geval niet in de gaten. Dat geeft te denken.

Dieper probleem

Bovendien gaat onder die rekenfouten van de overheid een veel dieper probleem schuil. Het is simpelweg niet eerlijk om verschillende kinderen verschillende toetsen te laten maken. Een beslissingsinstrument dat zo belangrijk is moet voor iedereen hetzelfde zijn. Het is daarom onverantwoordelijk scholen onder het mom van marktwerking en keuzevrijheid verschillende toetsen te laten gebruiken.

Er bestaan op dit moment naar onze mening geen statistische of psychometrische methoden die vergelijkbaarheid van de scores op verschillende toetsen voldoende kunnen garanderen. Het lijkt allemaal leuk en aardig dat scholen zelf hun toets kunnen kiezen. Maar willen ouders echt dat het schooladvies voor hun kind afhangt van de keuze van hun school voor de ene of de andere toets?

De selectietoets voor het hoger onderwijs moet voor ieder kind hetzelfde zijn. Daarom moet de regering ervoor zorgen dat er één eindtoets is, waarvan de kwaliteit en eerlijkheid zorgvuldig door de overheid bewaakt wordt. Die gestandaardiseerde eindtoets is een verworvenheid van het Nederlandse systeem en moet een belangrijke rol blijven spelen in het schooladvies.