Inleiding

De relevantie van het onderwijs in professioneel gedrag voor artsen komt voort uit de relatief autonome status van de professie, waarbij deze beroepsgroep op grond van gespecialiseerde kennis het recht verworven heeft een eigen gedragscode en beoordelingscriteria op te stellen, en zelf sancties op te leggen aan overtreders van de code. Het behoren tot een specifieke beroepsgroep is gebonden aan professioneel gedrag, dat deels beschreven staat in een gedragscode. De noodzaak van onderwijs in professioneel gedrag blijkt uit Amerikaans onderzoek, waarin aangetoond wordt dat er een sterke relatie is tussen het voorkomen van disciplinaire maatregelen onder praktiserende artsen en eerder vertoond onprofessioneel gedrag tijdens de opleiding geneeskunde.1-3

In de opleiding geneeskunde vindt onderwijs in professioneel gedrag plaats op basis van de eindtermen in het Raamplan4 en het CanMEDS model.5 Vanwege het ontbreken van adequate meetinstrumenten is het effect van dit onderwijs op de ontwikkeling van professioneel gedrag van studenten gedurende de opleiding geneeskunde nog nauwelijks onderzocht. Om een geschikt meetinstrument te kunnen ontwikkelen is het in de eerste plaats van belang te weten hoe professioneel gedrag in de opleiding geneeskunde wordt gedefinieerd. Professioneel gedrag van artsen betreft observeerbaar gedrag dat voortvloeit uit opvattingen over de beroepsuitoefening en waarin de normen en waarden van de beroepsgroep zichtbaar zijn; het ijkpunt is het welzijn van de patiënt.6

Professioneel gedrag is waarneembaar in de wijze waarop wordt omgegaan met taken/werk, met anderen en met zichzelf. Daar professioneel gedrag gekoppeld is aan de beroepspraktijk is dit bij studenten het beste te observeren en te beoordelen tijdens de coschappen in de masterfase van de studie. Om professioneel gedrag te kunnen ontwikkelen en zo nodig bij te kunnen sturen, is het belangrijk om reeds in de bachelorfase een aantal voorspellende factoren boven tafel te krijgen. Concrete voorbeelden zijn een verregaande terughoudendheid, faalangst, weinig sociaal gevoel, het niet kunnen onderscheiden van hoofden bijzaken en onvolwassen gedrag.7

Het opsporen en beïnvloeden van professioneel gedrag is mogelijk door een combinatie van gedragsbeoordelingen en het in kaart brengen van opvattingen van de studenten. Opvattingen zijn gekoppeld aan zowel persoonlijke waarden en normen als aan gevoelens en voornemens en hebben een sturende werking op het feitelijke gedrag in de praktijk. De integratie van waarden en normen van de beroepsgroep (zoals weerspiegeld in de eind termen van het Raamplan) met de persoonlijke waarden en normen, is een belangrijk onderdeel van de medisch professionele vorming. Medisch professionele vorming is een proces van jaren, waarin de aankomende arts een eigen, authentieke stijl ontwikkelt om zijn kennis en vaardigheden in dienst te stellen van een goede gezondheidszorg. Gedragsinstructie alleen is niet voldoende om dit te bewerkstelligen.6 8 Zo blijkt uit Canadees onderzoek9 dat al in de periode voorafgaand aan de opleiding en in het eerste jaar een set waarden en normen ten aanzien van de beroepsuitoefening wordt gevormd, die zich nog moeilijk laat beïnvloeden door de latere colleges ethiek.

In het medisch onderwijs in Nederland is inmiddels ruime ervaring opgedaan in het onderwijs in en het beoordelen van professioneel gedrag. In Groningen wordt studentgedrag in werkgroepen beoordeeld door tutoren met behulp van een beoordelingslijst.10 Maastricht heeft de eerste stappen gezet om de formatieve en de summatieve aspecten (het leren en het toetsen) in het medisch praktisch onderwijs te concentreren in vaste groepen. Dit maakt een longitudinale studie naar de professionele ontwikkeling van studenten mogelijk.11

Belangrijk is om vast te stellen welke elementen van professioneel gedrag in welke onderwijsactiviteit besproken en getoetst kunnen worden. De voorkeur gaat uit naar kleinschalige activiteiten, waarin jaargenoten en docenten de student meerdere malen zien functioneren.12 Een beoordelingssysteem van professioneel gedrag door studiegenoten behoort ook tot de mogelijkheden maar wel onder een aantal voorwaarden, zoals anonimiteit, directe feedback, formatief gebruik in een ondersteunende omgeving en met aandacht voor zowel professioneel als onprofessioneel gedrag.13

In de ontwikkelingsfase tijdens de opleiding geneeskunde kan men nog niet van alle studenten een volwassen professionaliteit verwachten met het vermogen gedrag in een context te plaatsen of zich in te zetten voor de gemeenschap c.q. voor het welzijn van anderen.14 In dit proces is de rol van mentoren van groot belang, met name het fungeren als rolmodel, het leren kennen van de ongeschreven code (het verborgen curriculum van professionaliteit), het geven van sociaal-emotionele steun en het inzetten van diens contacten ten gunste van de student.15 In een kwalitatieve studie onder tutoren16 is een aantal factoren in kaart gebracht die de professionele ontwikkeling van studenten geneeskunde positief of negatief kunnen beïnvloeden. Het betreft lesgeven/krijgen, reflectie, integratie in het studieprogram ma, vroege patiëntcontacten, het verborgen curriculum, werken in kleine groepen, dezelfde tutor over een langere periode en het gebruik van een portfolio.

In de VS is een van de eerste betrouwbare en valide instrumenten ontwikkeld voor het meten van de attitude van studenten ten opzichte van professionaliteit.17 In dit onderzoek willen wij de vraag beantwoorden of het ook in Nederland mogelijk is om op basis van de eindtermen in het Raamplan uit de categorie ‘Persoonlijke aspecten’ te komen tot een betrouwbare en valide vragenlijst waarmee de opvatting van studenten over professioneel gedrag van artsen gemeten kan worden. De vragenlijst werd ingevuld door studenten, assistenten in opleiding en docenten met een medische achtergrond. De opvattingen over professioneel gedrag bleken al in een vroeg stadium van de opleiding in kaart gebracht te kunnen worden. Het belang van een Nederlandse vragenlijst vloeit voort uit het feit dat professioneel gedrag niet alleen beroeps gebonden maar ook cultuurgebonden is.

Doel van dit onderzoek is het ontwikkelen van een vragenlijst aan de hand waarvan de opvatting van studenten over professioneel gedrag gemeten kan worden en die tevens geschikt is voor herhaalde meting in zowel de bachelor- als de masterfase. Op termijn zou met een dergelijke vragenlijst de ontwikkeling van de opvattingen gevolgd kunnen worden gedurende alle studiejaren en onderzocht kunnen worden of er een verband is tussen de opvattingen over professioneel gedrag tijdens de bachelorfase en het geobserveerde professioneel gedrag tijdens de coschappen.

Methode

Opzet

De vragenlijst werd ontwikkeld door de afdeling Medische Psychologie van het UMC St. Radboud te Nijmegen. Bij 42 eindtermen uit het Raamplan 2001 in de categorie ‘Persoonlijke aspecten’ (artspatiëntrelatie, persoonlijk functioneren, wederzijdse beïnvloeding werk-privéleven) werden zes concrete gedragsbeschrijvingen gemaakt die werden gepresenteerd als stellingen met als doel de impliciete opvattingen van studenten geneeskunde over de beroepsuitoefening van artsen zichtbaar te maken. Deze gedragsbeschrijvingen werden vervolgens door twee docenten medische psychologie – beiden met ruime ervaring in het onderwijs geneeskunde – beoordeeld op begrijpelijkheid en relevantie. Het doel van deze beoordeling was kwaliteitsverbetering van de lijst en een reductie tot twee gedragsbeschrijvingen per eindterm. Ter voorkoming van sociaal wenselijke antwoorden werd per item een bevestigende en een ontkennende beschrijving gekozen. Zo ontstond een vragenlijst met 84 items, te scoren op een vijfpuntsschaal (1=helemaal oneens, 2=oneens, 3=neutraal, 4=eens, 5=helemaal eens en omgekeerd voor de ontkennende stellingen). Deze vragenlijst werd ingevuld door 148 tweedejaarsstudenten geneeskunde en door zeven docent-mentoren (praktiserende artsen en medisch specialisten). Het doel van het invullen van de lijst door docent-mentoren was zowel het opsporen van differentiatie tussen de antwoorden van studenten en docent-mentoren als het krijgen van inhoudelijke feedback om het instrument verder te ontwikkelen.

Analyse

Op grond van de vergaarde gegevens van studenten en docent-mentoren op de vragenlijst met 84 items werd in de eerste plaats onderzocht of het mogelijk was de lijst in te korten met behoud van interne consistentie. Daarvoor werd bepaald wat de interne consistentie van de antwoorden van elk van beide steekproeven was, welke beweringen (items) de interne consistentie van de lijst positief dan wel negatief beïnvloedden, en of er verschil met betrekking tot de interne consistentie was tussen de neutrale en gespiegelde items; ook werd gekeken of het mogelijk was de subparagrafen van het Raamplan als subschalen te gebruiken.

Ten tweede werd nagegaan of het mogelijk was de lijst zo te construeren dat deze differentieert tussen studenten en docenten. Verschillen tussen studenten geneeskunde en docent-mentoren werden berekend in de gemiddelden van hun scores en in de standaardafwijkingen van deze gemiddelden. Verder werden verschillen in de range van de scores tussen studenten en docent-mentoren bepaald en werd vastgesteld welke items beter beoordeeld worden door studenten dan door docenten.

Tot slot werden verschillen gezocht tussen de items die bijdragen aan de interne consistentie van de antwoorden van studenten en de items die bijdragen aan de interne consistentie van de antwoorden van docent-mentoren. Van de antwoorden van deze twee onafhankelijke steekproeven werden de interne consistentie Cronbach’s alpha, de totaalcorrelatie en de alpha voor de schaal berekend als dit item wordt weggelaten. Twee verkorte lijsten van 42 items werden gecreëerd door van elke twee gedrags beschrijvingen per item slechts die gedragsbeschrijving te handhaven die het meest bijdroeg aan de interne consistentie van respectievelijk de docentgegevens en de studentgegevens. Dit resulteerde in een lijst met vragen die door de docent-mentoren het meest consistent beantwoord werden en een lijst met vragen die door de studenten het meest consistent beantwoord werden. Deze twee lijsten hadden 20 items gemeenschappelijk. Een belangrijke reden voor deze bewerking was het uitgangspunt dat alle eindtermen uit het gekozen deel van het Raamplan vertegenwoordigd moesten zijn.

De interne consistentie van de antwoorden van de docent-mentoren werd gekozen als uitgangspunt voor de validiteit van de vragenlijst. Daarmee werd de lijst met de 42 items waarop docenten het meest consistent antwoordden, de definitieve lijst. Om vast te stellen of deze vragenlijst differentieerde tussen studenten en docenten werden de frequenties van beide steekproeven op alle 42 items berekend, alsmede de range, het gemiddelde en de standaarddeviatie. Tevens werd een T-toets uitgevoerd voor de verschillen in gemiddelden van zowel de scores als de range tussen de twee onafhankelijke steekproeven van studenten en docent-mentoren en een F-toets voor de verschillen in standaarddeviatie.

Resultaten

Interne consistentie

De oorspronkelijke lijst van 84 items laat voor de studenten een hogere Cronbach’s alpha zien dan voor de docent-mentoren (Tabel 1). De interne consistentie van de subschalen uit het Raamplan is overwegend laag: voor studenten variërend van .61 voor subschaal 1 (24 items), .81 voor subschaal 2 (56 items), en .19 voor de subschaal met slechts vier items. De waarden voor de docenten zijn: .44 voor subschaal 1, .55 voor subschaal 2 en .02 voor subschaal 3. De interne consistentie van de docentgegevens is beduidend lager voor de gespiegelde vragen dan voor de ongespiegelde vragen. Voor de studenten is het verschil te verwaarlozen. De definitieve lijst van 42 items die door de docenten het meest consistent werden beantwoord, vertoont wat betreft de beantwoording door de studenten een iets lagere interne consistentie. De interne consistentie van deze vragenlijst is voor beide steekproeven goed.

Tabel 1 Cronbach’s alpha’s van de neutrale vragen en gespiegelde vragen in de totale vragenlijst in de oorspronkelijke en definitieve versie.

Onderscheidend vermogen van de vragenlijst

In de definitieve vragenlijst zijn de verschillen tussen de gemiddelden van docent-mentoren en studenten op itemniveau en op subschaalniveau voor 80% niet significant. Op itemniveau zijn de verschillen significant voor slechts negen van de 42 items (zie Tabel 2). De standaarddeviaties van deze gemiddelden verschillen voor vier van de 42 items significant. Twaalf van de 42 vragen zijn door de studenten beter beantwoord, waarvan één vraag significant beter.

Tabel 2 Overzicht van negen items, waarvan de gemiddelde scores van studenten en docenten significant verschillen.

Op het niveau van de subschaal zijn de verschillen tussen de gemiddelden van docenten en studenten significant bij slechts één van de vijf subschalen: persoonlijk functioneren; medisch handelen. Op schaalniveau zijn de verschillen in gemiddelden van studenten en docenten wel significant (zie Tabel 3). Dit verschil was niet significant in de oorspronkelijke lijst.

Tabel 3 Gemiddelde scores van studenten en docenten op de subschalen in de categorie ‘Persoonlijke aspecten’ van het Raamplan 2001 en verschillen in gemiddelden.

Voor alle items is de gemiddelde range bij de studenten groter dan bij de docenten. De gemiddelde range van de studentenscores (3.45) verschilt op schaalniveau significant (p<0.001) van de gemiddelde range van docentenscores (1.71). Ook de standaarddeviaties bij deze gemiddelden verschillen significant (p<0.05) voor studenten (.63) en docenten (.94).

Conclusie

Een vragenlijst met 42 items voor het meten van opvattingen over de beroepsuitoefening van studenten, met een goede interne consistentie, werd geconstrueerd. Dit geeft een goede indicatie voor de betrouwbaarheid, hoewel de test-hertest betrouwbaarheid in dit onderzoek nog niet werd bepaald.

De belangrijkste investeringen in de validiteit van de vragenlijst zijn achtereenvolgens het feit dat de items gebaseerd werden op het Raamplan, dat de scores van docent-mentoren als norm werden genomen en dat de helft van de vragen gespiegeld werd, dit om sociaal wenselijke antwoorden te voorkomen. Het Raamplan is een goede bron gebleken voor het ontwerpen van een meetinstrument voor de opvattingen over professioneel gedrag. Dit onderzoek heeft geen resultaten opgeleverd die op het tegendeel wijzen. Bovendien verhoogt een dergelijke keuze de acceptatie van het meetinstrument door de medische beroepsgroep. De aanname dat subparagrafen van het Raamplan als subschalen van de vragenlijst dienst konden doen moest herroepen worden op grond van de geringe interne consistentie van de subschalen.

Uit het Raamplan werd de categorie ‘Persoonlijke aspecten’ gekozen omdat deze de meeste elementen van professioneel gedrag bevat. Er was een zeker spanningsveld tussen het doel om alle eindtermen af te dekken en het doel de interne consistentie zo maximaal mogelijk te maken. In het laatste geval waren niet meer alle eindtermen gedekt. Dit werd niet acceptabel gevonden.

Het belang van differentiatie in de antwoorden van studenten en docent-mentoren is gelegen in de aanname dat de opvattingen van docent-mentoren verder geëvolueerd zijn dan die van studenten en dat er voor de studenten nog wat te leren is. Dat zou zichtbaar moeten zijn in een verschil tussen de gemiddelden van studenten en docent-mentoren en in een kleinere standaarddeviatie bij docentmentoren dan bij studenten. Verwacht mag worden dat deze verschillen in de loop van de opleiding kleiner zullen worden. Wel moet hier worden opgemerkt dat het aantal van zeven docent-mentoren erg weinig is. Een herhalingsonderzoek onder een groot aantal docent-mentoren is aan te bevelen, maar kon in het kader van dit onderzoek niet meer worden gerealiseerd.

De gemiddelden van de docenten waren doorgaans hoger dan die van de studenten, maar de verschillen waren voor het merendeel van de items en de subschalen niet significant. Op schaalniveau zijn de verschillen tussen studenten en docenten wel significant, hetgeen een bevestiging is van de keuze om alle items vertegenwoordigd te hebben in de schaal. De vragenlijst differentieerde met name met betrekking tot de range van de antwoorden. Het verschil in gemiddelden tussen de docentmentoren en de studenten op schaal niveau was niet significant in de oorspron kelijke lijst, maar wel in de definitieve lijst. Dit betekent dat de verkorte lijst differentieert tussen studenten en docent-mentoren en dat het inkorten ook in dit opzicht goed heeft gewerkt. Dit geldt in nog sterkere mate voor de range: het verschil in de gemiddelden van de range op schaal niveau tussen de studenten en de docent-mentoren was groter voor de definitieve lijst dan voor de oorspronkelijke lijst.

Het gevolg van de beslissing om bij het inkorten van de vragenlijst de interne consistentie van de antwoorden van de docenten als norm te nemen had diverse gevolgen. De beweringen waarop studenten consistent antwoorden zijn inhoudelijk niet altijd dezelfde als de beweringen waarop de docent-mentoren een consistent antwoord geven. Bij 22 items lijken de bevestigende en de ontkennende gedragsbeschrijvingen de studenten en de docent-mentoren te verdelen. Hier komen verschillen in referentiekader tussen beide groepen aan het licht. Informatie die mogelijk belangrijk kan zijn voor het leerproces bij professioneel gedrag wordt door de keuze van de docent-mentoren als norm niet zichtbaar. Docent-mentoren antwoordden bijvoorbeeld meer consistent dan studenten op de beschrijving:

“Een arts is zich bewust van de verleiding dat hij geneesmiddelen, waarvan de fabrikant op congressen relatiegeschenken uitdeelt, net iets vaker voor zal schrijven”.

Studenten antwoordden meer consistent op de gedragsbeschrijving bij het zelfde item waarin een ontkennend element staat:

“Als een arts via zijn werkcontacten een paar interessante nevenfuncties kan krijgen dan is daar niets op tegen.”

In beide gevallen zijn de antwoorden van de docent-mentoren meer conform de eindtermen. Wat de verschillen zijn tussen de vragen die wel een betrouwbaar antwoord aan de studenten ontlokken, maar niet aan de docenten (en vice versa) kan nog aan een kwalitatieve analyse onderworpen worden. Om tot subschalen te komen die intern consistent zijn, is een factoranalyse een wenselijke optie. Daarmee wordt de vragenlijst ook vergelijkbaar met het meetinstrument uit de VS25 en krijgt de vragenlijst inhoudelijk meer diepte.

Uit het literatuuronderzoek bleek dat de opvattingen van bachelorstudenten geneeskunde over de beroepsuitoefening invloed hebben op het professioneel gedrag in de masterfase 6 8-9 en dat dit gedrag gerelateerd is aan het professioneel gedrag in de latere beroepsuitoefening.1-3

De bevindingen uit het onderzoek geven aanleiding om de vragenlijst te gaan gebruiken in vervolgonderzoek. Het laten invullen van de definitieve vragenlijst door grotere groepen docent-mentoren en medisch specialisten in (academische) medische centra zou kunnen leiden tot een verbetering van de validiteit van de vragenlijst. Bij verder onderzoek onder studenten geneeskunde verdient het aanbeveling de vragenlijst twee maal te laten invullen door dezelfde studenten van de steekproef voor het vaststellen van de testhertest betrouwbaarheid. Ook zouden twee gematchte steekproeven van bachelor studenten met elkaar vergeleken kunnen worden. Verdere verbetering van de psychometrische kwaliteiten van de vragenlijst zal bijdragen aan het uiteindelijke doel om de ontwikkeling van professioneel gedrag van studenten geneeskunde tijdens hun opleiding longitudinaal te volgen.

Belangenconflict: geen gemeld

Financiële ondersteuning: geen gemeld