Opinie

‘Eindtoets is wél belangrijk voor eerlijk schooladvies’

De stelling dat een gestandaardiseerde eindtoets niet zo belangrijk is, is gevaarlijk naïef. Dat stellen drie hoogleraren en een universitair docent. 

Beeld Marcel van den Bergh/Hollandse Hoogte

Kinderen worden in Nederland al op 11- of 12-jarige leeftijd geselecteerd voor het voortgezet onderwijs. Op basis van het schooladvies wordt de keuze gemaakt voor vwo, havo, of vmbo en daarmee ligt dat schooladvies aan de basis van een beslissing die de levens van Nederlandse kinderen bepaalt. Het schooladvies moet degelijk en eerlijk zijn en de overheid dient daarvoor zorg te dragen. De uitspraken die minister Arie Slob (Basis- en Voortgezet Onderwijs) vorige week in Het Parool deed zijn daarom reden tot grote zorg.

Volgens Slob kan de gestandaardiseerde eindtoets een kleinere rol spelen omdat het schooladvies ‘professionele keuzes en goede inschattingen’ reflecteert. Een eeuw psychologisch en onderwijskundig onderzoek heeft echter ondubbelzinnig uitgewezen dat het menselijk oordeel juist gewantrouwd moet worden.

Bij ingewikkelde beslissingen op basis van onvolledige informatie vallen mensen terug op kennis die zij menen te hebben over de wereld. In het geval van het oordeel over leerlingen is die kennis vaak georganiseerd in stereotypen die niet kloppen: meisjes zijn niet goed in wiskunde, wie voor een dubbeltje geboren is, zal nooit een kwartje worden.

Geen kwade wil

Het menselijk oordeel wordt gemakkelijk vertekend, wat tot ongewenste gevolgen leidt. Een recent rapport van het Centraal Bureau voor de Statistiek toont bijvoorbeeld ondubbelzinnig aan dat het schooladvies van leerkrachten gemiddeld genomen lager is voor meisjes dan voor jongens, ook al hebben ze dezelfde testscore.

Het is belangrijk op te merken dat hier geen kwade wil in het spel hoeft te zijn: vertekeningen in het menselijk oordeel vinden onder ­andere plaats door automatische informatieverwerking die onbewust plaatsvindt: dat is precies wat het menselijk oordeel zo link maakt. Het vertrouwen dat Slob uitspreekt in het menselijk oordeel is gevaarlijk naïef.

In Nederland wordt het menselijk oordeel om deze reden geflankeerd door een objectievere maat, namelijk een testscore. Het idee hierachter is dat testscores minder gevoelig zijn voor stereotypen, omdat het toetsingsproces gestandaardiseerd en dus voor iedereen hetzelfde is.

Uit onderzoek blijkt inderdaad dat de mate van vertekening in testscores over het algemeen kleiner is dan die in het menselijk oordeel (hoewel ook toetsen doorgaans niet volledig eerlijk zijn). Dit betekent niet dat het menselijk oordeel irrelevant is. Wij zijn net als de meeste andere psychometrici van mening dat men het menselijk oordeel en de testscore moet combineren. Dat laat onverlet dat het gebruik van een gestandaardiseerde test met het oog op eerlijkheid en transparantie een essentieel onderdeel van de selectieprocedure is. Tenminste, als voor alle leerlingen dezelfde toets gebruikt wordt. Dat is in Nederland sinds enkele jaren niet meer het geval.

Waar oorspronkelijk één eindtoets werd gebruikt (namelijk die van het Cito) zijn er op dit moment diverse aanbieders van toetsen. Deze aanbieders volgen verschillende methoden, gebruiken verschillende opgaven en baseren zich op verschillende modellen en scoringsregels. Volgens Slob is dit niet erg, want ‘scholen waarderen de keuze tussen verschillende toetsen; die variatie past ook bij het Nederlandse onderwijssysteem’.

Complexe klus

Ook dit is een gevaarlijk naïeve opvatting. De scores van leerlingen in verschillende toetsen zijn niet zonder meer met elkaar te vergelijken. Met andere woorden: we weten niet hoe een score van 220 op de toets van Route 8 zich verhoudt tot een score van 540 op de Citotoets. Als men zulke scores al vergelijkbaar kan maken, is dat een bijzonder complexe en tijdrovende klus. Huidige statistische en psychometrische methoden die scores uit verschillende toetsen vergelijkbaar moeten maken, zijn gebaseerd op zeer sterke aannames over de meeteigenschappen van de toetsen en de schaaleigenschappen van de gemeten vaardigheden. De validiteit van die aannames is moeilijk na te gaan en dat betekent dat de eerlijkheid van de selectieprocedure niet goed is vast te stellen.

Slob denkt dat het allemaal niet zo’n probleem is. ‘Het College voor Toetsen en Examens wordt de toezichthouder van alle toetsen en moet ervoor zorgen dat ze onderling goed te vergelijken zijn,’ zegt Slob op de website van Het Parool. Alweer naïef. Als men de verschillende scores al vergelijkbaar kan maken, dan is dat een ingewikkelde en tijdrovende klus die eigenlijk alleen te begrijpen is door experts.

Hoe complex en weinig transparant de methodologie is, bleek enkele weken geleden wel, toen naar buiten kwam dat door een rekenfout aan zo’n 20.000 achtstegroepers verkeerde uitslagen waren verstrekt. De fout was blijkbaar iedereen ontgaan en kwam alleen aan het licht doordat het leerkrachten en ouders was opgevallen dat de adviezen in sommige groepen consequent te hoog waren. Als de fout niet systematisch was geweest maar willekeurige leerlingen had getroffen, was hij wellicht nooit opgemerkt. Het College voor Toetsen en Examens had hem in elk geval niet in de gaten. Dat geeft te denken.

Dieper probleem

Bovendien gaat onder die rekenfouten van de overheid een veel dieper probleem schuil. Het is simpelweg niet eerlijk om verschillende kinderen verschillende toetsen te laten maken. Een beslissingsinstrument dat zo belangrijk is moet voor iedereen hetzelfde zijn. Het is daarom onverantwoordelijk scholen onder het mom van marktwerking en keuzevrijheid verschillende toetsen te laten gebruiken.

Er bestaan op dit moment naar onze mening geen statistische of psychometrische methoden die vergelijkbaarheid van de scores op verschillende toetsen voldoende kunnen garanderen. Het lijkt allemaal leuk en aardig dat scholen zelf hun toets kunnen kiezen, maar willen ouders echt dat het schooladvies voor hun kind afhangt van de keuze van hun school voor de ene of de andere toets?

De selectietoets voor het hoger onderwijs moet voor ieder kind hetzelfde zijn. Daarom moet de regering ervoor zorgen dat er één eindtoets is, waarvan de kwaliteit en eerlijkheid zorgvuldig door de overheid wordt bewaakt. Die gestandaardiseerde eindtoets is een verworvenheid van het Nederlandse systeem en moet een belangrijke rol blijven spelen in het schooladvies.

Denny Borsboom, hoogleraar Psychologische methodenleer (UvA)

Eric-Jan Wagenmakers, hoogleraar Psychologische methodenleer (UvA)

Maarten Marsman, universitair docent (UvA)

Rob Meijer, hoogleraar Psychometrische en statistische technieken (RUG) 

Reactie College voor Toetsen en Examens

Onlangs verscheen er op parool.nl een opiniestuk van Denny Borsboom, Eric-Jan Wagenmakers, Maarten Marsman en Rob Meijer met de titel ‘Eindtoets is wel belangrijk voor eerlijk schooladvies’. In dit artikel wordt de suggestie gewekt dat het College voor Toetsen en Examens in de gaten had kunnen hebben dat er verkeerde eindtoetsuitslagen zijn verstrekt aan achtstegroepers.

Het College voor Toetsen en Examens is verantwoordelijk voor de Centrale Eindtoets. De toets van de overheid. Daarnaast zijn er vier eindtoetsen van commerciële partijen op de markt. Op dit moment heeft het College voor Toetsen en Examens geen enkele bemoeienis met de omzetting van toetsresultaten naar toetsadviezen van de andere eindtoetsen, het proces waarin de fout met de verkeerde toetsuitslagen is ontstaan. Ook hebben wij geen zicht op de toetsadviezen van de andere aanbieders. Dat wij hadden kunnen signaleren dat er fouten waren ontstaan, is dus uitgesloten.

Namens het College voor Toetsen en Examens,

Pieter Hendrikse, voorzitter 

Meer over

Wilt u belangrijke informatie delen met Het Parool?

Tip hier onze journalisten


Op alle verhalen van Het Parool rust uiteraard copyright. Linken kan altijd, eventueel met de intro van het stuk erboven.
Wil je tekst overnemen of een video(fragment), foto of illustratie gebruiken, mail dan naar copyright@parool .nl.
© 2019 DPG Media B.V. - alle rechten voorbehouden