Inleiding

De afgelopen jaren zijn in Utrecht en Maastricht vierjarige opleidingen geneeskunde gestart die als doel hebben studenten met een (biomedische) vooropleiding in vier jaar tijd op te leiden tot artsen met hetzelfde eindniveau als studenten uit zesjarige curricula. Echter, de kennisniveaus van studenten uit vier- en zesjarige curricula in Nederland zijn nog niet eerder met elkaar vergeleken. Het doel van deze studie is een dergelijke vergelijking uit te voeren.

Eén van deze opleidingen is SUMMA (School for Utrecht Medical Masters – sinds 2006 ‘Selective Utrecht Medical Master’), een vierjarige opleiding die in 2003 in het UMC Utrecht van start is gegaan. Deze masteropleiding leidt studenten met een biomedische of aanverwante vooropleiding op voor het beroep van arts. De SUMMA opleiding heeft dezelfde eindtermen, beschreven in het Raamplan 2001, als de zesjarige opleiding van het UMC Utrecht (CRU ’99 – Curriculum Utrecht 1999).1 Vanaf 2006 is SUMMA tevens een research master en zijn kleine veranderingen in het curriculum doorgevoerd. Om toegelaten te worden tot de SUMMA opleiding worden kandidaten getoetst op kennis van elf (bio-) medische vakgebieden, moeten zij een essay schrijven en een test op het gebied van patiëntencommunicatie uitvoeren; ook vindt er een gesprek met de selectiecommissie plaats. Op jaarbasis worden circa 40 studenten geselecteerd voor de opleiding. Voor het zesjarige CRU worden jaarlijks circa 300 studenten zonder decentrale selectie toegelaten.

Het UMC Utrecht kent met CRU en SUMMA twee medische curricula van verschillende duur maar met het zelfde einddoel. In 2006 zijn de eerste SUMMA studenten afgestudeerd. Deze voor Nederland unieke situatie rechtvaardigt een toetsing van de beoogde vergelijkbaarheid bij afstuderen, zodra dat mogelijk is.

Vier- en zesjarige medische opleidingen zijn in het mondiale medisch onderwijs bekende varianten. Het Noord-Amerikaanse model is een vierjarige opleiding, voorafgegaan door een veelal vierjarig college. In Europa zijn zesjarige opleidingen het meest gangbaar. Hoewel er in Europa in toenemende mate discussie wordt gevoerd over een curriculummodel met een bachelor gevolgd door een master, zijn de argumenten voor en tegen een bachelor- en masterfase niet gebaseerd op empirische gegevens over het bereikte kennisniveau.2 Voor zover wij kunnen nagaan zijn dergelijke vergelijkende studies in de literatuur nog niet verschenen.

Mogelijke verschillen tussen studenten uit vier- en zesjarige curricula kunnen wellicht verklaard worden vanuit een aantal factoren, zowel factoren inherent aan de opleiding als studentgebonden factoren. In een studie van Terwisscha van Scheltinga et al. uit 2006 worden studenten uit de reguliere opleiding en uit de zij-instroom (Groningen) met elkaar vergeleken.3 Zij constateerden dat de zij-instroom studenten in het begin van het brugjaar – gericht op instroom in de reguliere opleiding – lager scoorden op de interfacultaire voortgangstoets dan studenten van de reguliere opleiding, maar zij stelden ook vast dat deze studenten binnen een jaar net zo goed scoorden als de reguliere studenten. Wilkinson et al.4 vergeleken studenten in gelijkwaardige vier- en zesjarige curricula aan de universiteit van Otago in Nieuw Zeeland. In hun analyse van de literatuur benadrukken zij dat verschillen in selectieprocedure, inrichting van de opleiding en in onderwijsvormen mogelijk de verschillen tussen vier- en zesjarige curricula verklaren. Aan de hand van vragenlijsten over leergedrag, studievoortgang en carrièreoverwegingen vergeleken zij studenten uit beide modellen die in hetzelfde curriculum onderwijs genoten. De belangrijkste voorspeller voor de uitkomstmaten bleek niet het type onderwijsmodel te zijn maar de leeftijd bij aanvang van de studie, waarbij een hogere leeftijd geassocieerd was met betere studieresultaten.4

Mogelijk kunnen de verschillen tussen studenten in beide modellen ook verklaard worden door verschillen in de toelatingsprocedure. Onderzoek naar de verschillen tussen studenten die via decentrale selectie versus loting zijn toegelaten liet zien dat geselecteerde studenten meer gemotiveerd zijn, meer tijd aan hun studie besteden en meer extra-curriculaire activiteiten ontplooien; de academische prestaties waren echter niet hoger dan die van 8+ studenten en van studenten die via loting werden toegelaten.5 Een vergelijkend onderzoek in Rotterdam liet zien dat toelating door middel van een selectieprocedure de kans op uitval in het eerste jaar verkleint en dat geselecteerde studenten meer extracurriculaire activiteiten ondernemen. Wat betreft de prestaties werden geen duidelijke verschillen in behaalde cijfers gevonden tussen decentraal geselecteerde studenten en studenten die via centrale loting werden geplaatst.6

Figuur 1.
figure 1

UVT afnames in de curricula CRU ’99 en SUMMA.

Zoals eerder genoemd kunnen eventuele verschillen tussen studenten in vier- of zesjarige modellen zowel het gevolg zijn van eigenschappen van de opleiding (curriculum, onderwijsvormen en toelatingsprocedure) als van eigenschappen van de student, zoals leeftijd en academische achtergrond, en van factoren die bepalen of de student toegelaten wordt (zowel bij loting als bij een selectieprocedure).

De Utrechtse medische opleiding kent geen vergelijkend eindexamen. De kennis van CRU en SUMMA studenten wordt gedurende de studie echter een aantal keren verplicht getoetst met de zogeheten Utrechtse Voortgangstoets (UVT). Studenten zijn verplicht tenminste driemaal aan de UVT deel te nemen en moeten zowel op een individuele toets als cumulatief een (voor beide groepen gelijke) minimale score halen om toegelaten te worden tot het laatste jaar van de opleiding. Dit laatste jaar kent voor beide groepen een vrijwel identiek programma, dit in tegenstelling tot de eerdere jaren van beide curricula. De UVT wordt drie keer per jaar afgenomen (in januari, mei en september). CRU studenten maken de toets voor het eerst aan het begin van het vierde jaar en SUMMA studenten aan het einde van het tweede jaar (Figuur 1).

De verwachting van dit onderzoek is dat er geen verschil is tussen het kennisniveau, gemeten met de UVT, van studenten van de vierjarige en van de zesjarige opleiding geneeskunde. Dit is immers ook het doel van beide opleidingen. Een verwachting van ‘geen verschil’ is echter niet toetsbaar, maar wij stellen dat aan onze verwachting vooralsnog is voldaan wanneer geen significant verschil kan worden aangetoond.

Methoden

Onderzoekspopulatie

In totaal hebben 398 studenten deelgenomen aan de UVT van januari 2008, waarvan 336 CRU studenten en 42 SUMMA studenten. De overige 20 studenten zijn buitenlandse artsen (binnengekomen via de Commissie Instroom Buitenlandse Artsen – CIBA); deze zijn in dit onderzoek buiten beschouwing gelaten. Alle vierde- en vijfdejaarsstudenten CRU en tweede- en derdejaarsstudenten SUMMA, die de toets voor de eerste, tweede of derde keer maakten, zijn geïncludeerd. Het vergelijken van resultaten van studenten die de toets vaker dan driemaal hebben afgelegd leidt tot minder goed vergelijkbare groepen. Immers, studenten die na drie UVT’s zijn geslaagd hoeven niet meer mee te doen met de toets, met als gevolg dat een minder goede groep overblijft.

Uitkomstmaat: het kennisniveau gemeten met de UVT

Het kennisniveau van studenten in de hogere jaren van de opleiding geneeskunde is gemeten door middel van de UVT van januari 2008. De UVT bestaat uit veertig korte casusbeschrijvingen met elk twee samengestelde vragen: een klinische vraag en een vraag over biomedische basisvakken. Alle vragen vergen een kort antwoord (short-answer question), zijn opgesteld met modelantwoord en scoringsaanwijzingen en zijn tevoren in twee ronden op kwaliteit beoordeeld en zo nodig bijgesteld.7 Van de 40 klinische vragen zijn er zes afkomstig van de interne specialismen, zes van de chirurgische specialismen, vier van respectievelijk neurologie, psychiatrie, gynaecologie/obstetrie en kindergeneeskunde en drie van respectievelijk huisartsgeneeskunde, KNO, dermatologie en oogheelkunde. De biomedische onderwerpen betreffen anatomie, fysiologie, farmacologie, celbiologie, pathologie, microbiologie, immunologie, genetica en public health.

In totaal kunnen maximaal 240 punten worden gehaald: 120 voor klinische kennis en 120 voor biomedische kennis (maximaal drie punten per vraag). Er worden geen punten afgetrokken voor incorrecte antwoorden. De vragen worden aangeleverd en nagekeken door een groot aantal clinici en docenten voor de basisvakken.

Analyses

Een herhaalde meting ANOVA voor klinische en biomedische kennis (binnenpersoons) is uitgevoerd met als factoren (tussenpersoons) het curriculum en de deelnamegroep (eerste, tweede of derde keer dat de UVT gemaakt werd). Hierbij is als significantieniveau α = 0.05 gebruikt. Verder is ook de klinische en biomedische kennis geanalyseerd met behulp van twee tweeweg ANOVA’s met curriculum en deelnamegroep als factoren (α = 0.025 na correctie volgens Bonferroni). Alle analyses zijn uitgevoerd met SPSS (versie 15.0).

Resultaten

In totaal maakten 85 (27%), 150 (47%) en 82 (26%) studenten de toets voor respectievelijk de eerste, tweede en derde keer. Van de CRU studenten vielen 278 binnen de onderzoekspopulatie; 71 van hen maakten de UVT voor de eerste, 144 voor de tweede en 63 voor de derde keer. Negenendertig SUMMA studenten maakten de UVT voor de eerste, tweede of derde keer; dit waren respectievelijk 14, 6 en 19 studenten. Zoals eerder beschreven zijn de resultaten van studenten die de toets voor de vierde keer of vaker maakten buiten beschouwing gelaten; dit waren 58 studenten CRU en drie studenten SUMMA.

De betrouwbaarheid van deze UVT (Cronbach’s alfa coëfficiënt) lag per deelnamegroep tussen de 0.81 en 0.85.

Tabel 1. De gemiddelde scores voor CRU versus SUMMA studenten op totale, klinische en biomedische kennis, uitgesplitst voor de eerste, tweede en derde deelname.

Tabel 1 geeft de gemiddelde scores en 95% betrouwbaarheidsintervallen voor totale, biomedische en klinische kennis weer voor de gehele groep en per deelname. Tabel 2 geeft de resultaten van de herhaalde metingen ANOVA weer. Hierin is te zien dat de totale kennis (het totaal van biomedische en klinische kennis) significant verschilt tussen beide curricula (p = 0.045). Uit Tabel 1 is af te leiden dat dit ten gunste is van SUMMA studenten. Tevens was er een significante relatie tussen de deelnamegroep en de totale score, waarbij studenten die de UVT vaker hebben gemaakt hoger scoren (p = 0.005). De interacties tussen curriculum en deelnamegroep en tussen vraagtype en deelnamegroep waren net als de drieweg interacties niet van significant belang. Er werden significante verschillen gevonden tussen beide vraagtypes (scores op klinische en biomedische vragen), p<0.001. Hieraan lijkt een significante interactie tussen curriculum en vraagtype ten grondslag te liggen (p = 0.005).

De tweeweg ANOVA’s geven een verdere analyse van dit verschil (zie Tabel 3). Hierin is te zien dat wat betreft de scores voor de klinische kennis er tussen beide curicula geen significante verschillen waren. De klinische kennis was echter wel significant beter bij studenten die de UVT vaker hadden gemaakt (p<0.001). De scores op biomedische kennis waren significant verschillend tussen CRU en SUMMA studenten en de deelnamegroep had hierop geen significant effect. Zoals uit Tabel 1 blijkt, vallen de verschillen gunstig uit voor SUMMA studenten. De hogere totale score behaald door SUMMA studenten wordt dus verklaard door een verschil in kennis van de biomedische vakken.

Tabel 2. Resultaten herhaalde metingen ANOVA klinische en biomedische kennis.
Tabel 3. Tweeweg ANOVA’s klinische en biomedische kennis.

Discussie

Wij konden een significant verschil aantonen op het totale kennisniveau tussen studenten van het vierjarige- en van het zesjarige curriculum. Bij uitsplitsing van scores voor klinische en biomedische kennis bleken de SUMMA studenten met name hoger te scoren op biomedische kennis, hetgeen het verschil in totale kennis kan verklaren. In absolute termen zijn de verschillen klein; wat betreft totale kennis scoren SUMMA studenten gemiddeld zeven punten hoger dan CRU studenten (op een maximum van 240 punten). Bij biomedische kennis is dit gemiddeld nog geen zes punten (op een maximum van 120 punten).

Het verschil in biomedische kennis is mogelijk te verklaren door de selectiecriteria voor de vierjarige opleiding; biomedische basiskennis wordt hierbij aanwezig geacht en getoetst. Post-hoc is een Pearson productmomentcorrelatie berekend met de toelatingstoets. Dit toonde een significante, positieve correlatie aan tussen de score op de toelatingstoets voor SUMMA en de score voor de biomedische kennis op de UVT (r = 0.39, p < 0.05), hetgeen deze veronderstelling aannemelijk maakt. Eerder onderzoek naar het kennisniveau van zij-instromers in Groningen heeft laten zien dat zij hetzelfde kennisniveau behalen als studenten van de zesjarige opleiding.3 De bevindingen uit dit onderzoek zijn daarmee in overeenstemming.

Dit onderzoek is een eerste vergelijking tussen het kennisniveau van studenten in het vierjarige en het zesjarige curriculum. Een sterk punt van het onderzoek is dat beide groepen studenten dezelfde UVT met dezelfde normering aflegden en dat de onder wijsomgeving, met uitzondering van het onderwijsprogramma, gelijk was. Beide groepen studeren in het Universitair Medisch Centrum Utrecht en krijgen voor een groot deel onderwijs van dezelfde docenten die grotendeels gebruik maken van dezelfde leermethodes; dit maakt een betere vergelijking van de resultaten mogelijk dan wanneer er sprake zou zijn van twee onderwijsinstellingen.

Er zijn echter ook beperkingen. Omdat beide curricula verschillend zijn ingericht wat betreft de volgorde van theoretische en klinische onderdelen, en ook wat betreft de afnamemomenten met betrekking tot de UVT, was het niet mogelijk toetsmomenten te vinden die op een volledig gelijkwaardig moment in het curriculum vallen. Gezien de heterogene verdeling over de eerste, tweede en derde deelnames is dit meegenomen als factor in de analyses. Verder is er niet gecorrigeerd voor leeftijd of geslacht. Ook is dit onderzoek gebaseerd op één voortgangstoets. Muijtjens et al. hebben laten zien dat er tussen voortgangstoetsen verschillen kunnen optreden.8 Toekomstig onderzoek dat gebruikt maakt van meerdere voortgangstoetsen kan de beschreven bevindingen mogelijk versterken.

Een verdere beperking is dat de toets niet is afgenomen op het moment van afstuderen. Dat is het moment waarop de informatie het meest relevant is. Wellicht is in de toekomst een onafhankelijke toets toepasbaar voor deze populatie. Als men echter uitgaat van de vraag of er kennisverschillen zijn bij afstuderen, is de veronderstelling gerechtvaardigd dat als er in het laatste jaar geen verschillen zijn, deze ook niet zullen optreden na het laatste jaar; het onderwijsprogramma is voor beide groepen immers nagenoeg gelijk.

Tot slot was de SUMMA groep niet erg groot, een probleem dat inherent is aan de kleinschaligheid van de opleiding. Het was echter wel mogelijk verschillen in biomedische kennis aan te tonen. Er werden geen statistisch significante verschillen gevonden in klinische kennis, hetgeen ofwel het gevolg kan zijn van te kleine groepsgroottes ofwel kan duiden op een werkelijke afwezigheid van een verschil. Als men kijkt naar de verschillen tussen scores op klinische kennis dan zijn deze gemiddeld minder dan twee punten (op een maximum van 120 punten), hetgeen – zelfs als dit bij grotere populaties significant zou worden – als een irrelevant verschil kan worden gezien.

Als men de resultaten vergelijkt voor de verschillende deelnamegroepen, dan lijkt er een leercurve te bestaan. Gezien de plaatsing van de UVT binnen beide curricula is het niet verrassend dat de scores op klinische kennis significant samenhangen met de deelnamegroepen, waarbij studenten die de UVT vaker hebben gemaakt hoger scoren. Harde uitspraken over de leercurves zijn echter niet gerechtvaardigd omdat hier sprake is van cross-sectioneel onderzoek en niet van een longitudinaal onderzoek waarbij studenten in de loop van de tijd gevolgd worden. Toekomstig longitudinaal onderzoek kan meer inzicht geven in de leercurves van studenten in het vier- of zesjarige curriculum en in eventuele verschillen hierin. Verder geeft dit onderzoek geen informatie over het toekomstige functioneren als arts of over de behaalde klinische competenties.

De uitkomsten van deze studie ondersteunen de veronderstelling dat het mogelijk is studenten met een niet-medische vooropleiding in vier jaar de eindtermen van de reguliere zesjarige basisartsopleiding te laten bereiken. Er zijn uiteraard nog andere competenties dan de toegepaste klinische en biomedische kennis die met de UVT wordt getoetst, maar het is een stap in de richting van de validering van het ‘graduate-entry’ model in de Nederlandse context.

Tot slot kan uit deze vergelijking van scores op de Utrechtse Voortgangstoets geconcludeerd worden dat het kennisniveau van studenten geneeskunde van de zesjarige CRU- en de vierjarige SUMMA-opleiding vergelijkbaar is. De significant hogere totaalscores van SUMMA studenten worden grotendeels verklaard door hogere scores op biomedische onderwerpen. De absolute verschillen in scores zijn desondanks klein. De biomedische scores zijn gecorreleerd aan de scores die gehaald zijn op de toelatingstoets die gemaakt wordt voordat men met SUMMA mag beginnen. Verder onderzoek is geïndiceerd om uitspraken te kunnen doen over de uiteindelijke kwaliteit van de artsen die door beide opleidingen worden afgeleverd en een (longitudinale) vergelijking van studenten uit de nieuwe curricula is gewenst zodra dit mogelijk is.

Voor zowel SUMMA als CRU zijn in 2006 aangepaste curricula van start gegaan waarvan de studenten nog niet hebben deelgenomen aan deze UVT. Om de uitkomsten van dit onderzoek te bevestigen is herhaling van dit onderzoek aan de hand van de UVT onder studenten van beide nieuwe curricula wenselijk.

Dankwoord

Wij danken drs. C. Kruitwagen voor zijn ondersteuning bij de statistische analyse en interpretatie.

De auteurs:

M.S.M. van Mourik BSc is studente geneeskunde in het SUMMA2006 curriculum*.

Dr. M.H. Kamphuis is studente geneeskunde in het SUMMA2006 curriculum*.

N.L. Plantinga is studente geneeskunde in het CRU’99 curriculum*.

Prof. dr. G. Croiset was ten tijde van dit onderzoek opleidingscoördinator SUMMA binnen de directie Onderwijs en Opleidingen* en nu programmadirecteur geneeskunde opleidingen VU Medisch Centrum.

Prof. dr. Th.J. ten Cate is directeur van het Expertisecentrum voor Onderwijs en Opleidingen*.

* Allen binnen het Universitair Medisch Centrum Utrecht.

Correspondentieadres:

M.S.M van Mourik, Rubenslaan 55, 3582JB, Utrecht. E-mail: m.s.m.vanmourik@students.uu.nl; tel: 06-53799975.

Belangenconflict: geen gemeld

Financiële ondersteuning: geen gemeld