Dit jaar zijn de havo wiskunde-examens volgens het nieuwe
programma alweer voor de derde keer afgenomen. Na de slechte start
van twee jaar geleden lijken de resultaten intussen behoorlijk
te zijn verbeterd. Maar zijn de aanloopproblemen echt voorbij of
is er meer aan de hand?
Laten we de laatste drie jaar van het oude programma (2014, 2015 en 2016)
eens vergelijken met de eerste drie jaar van het nieuwe programma
(2017, 2018 en 2019). Omdat de systematiek van de N-termen zo werkt dat
de cijferverschillen bij een verandering van examenprogramma klein blijven,
kijken we naar de cijfers die behaald zouden zijn als de N-term
altijd precies 1,0 zou zijn geweest. Op die manier komt de ontwikkeling
van de cijfers exact overeen met die van de procentuele scores.
In de grafiek hierboven zijn ook de gemiddelde waarderingscijfers
verwerkt die de docenten in de WOLF-enquête aan de examens toekenden.
De terugval in resultaten bij het eerste nieuwe examen is duidelijk
te zien. De laatste twee examen gaven een aanzienlijke verbetering
te zien en de resultaten van het laatste examen zijn zelfs weer ongeveer
van het oude niveau. Deze positieve ontwikkeling verschilt duidelijk
van de ontwikkeling bij de andere wiskunde-examens. Zie hiervoor
WiskundE-brief 850.
Weinig waardering
Docenten geven aan de nieuwe examens veel lagere cijfers dan aan de oude
examens. Het is uiteraard niet verwonderlijk dat het eerste, slecht
gemaakte examen een dikke onvoldoende kreeg. Het herstel dat in
examenjaar 2018 leek te zijn ingezet, werd voor 2019 echter niet
gecontinueerd. De 5,7 van 2019 blijft ver achter bij de 7,0 van het
laatste oude examen.
Bij de slechtere beoordeling door docenten lijken twee zaken een
belangrijke rol te spelen. Het zijn de lengte van het examen en de
aansluiting van het examen op het gegeven onderwijs. Vorig jaar vond
maar liefst 80% van de docenten het examen te lang. Bij de oude
examens was dat steeds hooguit ongeveer 40%. Meer dan de helft van
de docenten vond de aansluiting op het onderwijs onvoldoende of slecht.
Bij de oude examens was meestal slechts een kleine minderheid deze
mening toegedaan.
De
moeilijkheid van de examens lijkt minder een rol te spelen.
De laatste twee jaar waren de percentages docenten die het examen
moeilijk of zelfs te moeilijk vonden ongeveer gelijk aan die in de
jaren 2014 en 2015.
Statistiek
De nieuwe benadering van het onderdeel statistiek drukt een zwaar
stempel op het examenprogramma en het Centraal Examen. Het lijkt
erop dat de wijze waarop de statistiek in het Centraal Examen is
verwerkt, bijdraagt tot de negatieve beoordeling van dit examen
door de docenten.
Oorspronkelijk was het de bedoeling dat het onderdeel statistiek,
net als op het vwo, uitsluitend in het schoolexamen zou worden
getoetst. In de pilotexamens van 2014 en 2015 ontbrak dit onderwerp
dan ook volledig. Deze twee pilotexamens werden door de kleine
groep betrokken docenten met gemiddelde scores tusen een 7,5 en
een 8,0 bijzonder hoog gewaardeerd. In 2016 werd de statistiek
in het pilotexamen geïntroduceerd. De waardering van dat examen
daalde toen plotseling tot onder de 6,0.
Kritiek vanuit de wetenschap
Ook uit wetenschappelijke hoek worden, zij het impliciet, kritische
opmerkingen gemaakt bij de wijze waarop de statistiek in het
wiskundeprogramma vorm heeft gekregen. De Vereniging voor Statistiek
en Operations Research (VVSOR) waarschuwt voor het gevaar dat
wetenschappelijk en statistisch denken wordt 'platgeslagen' tot een
stappenplan met vuistregels. In een
recente
publicatie laten Arthur Bakker en anderen zien dat het toekennen van
kwalificaties als 'gering', 'matig' en (zeer) 'groot' aan
berekende effectgroottes wat meer voeten in de aarde heeft dan de
tabel die bij het examen wordt verstrekt, suggereert. Zie hiervoor
ook de presentatie
"Effect
sizes are not t-shirt sizes" van Arthur Bakker.
Er lijkt mij nog veel werk te doen.
gk