Introductie

Het diagnostische proces dat wordt doorlopen alvorens de diagnose prostaatkanker (PCa) wordt gesteld, gaat gebukt onder overdiagnostiek en het verrichten van onnodige prostaatbiopten [1]. De European Association of Urology adviseert bij PCa een risicocalculator te gebruiken ter ondersteuning van de beslissing een MRI-scan of prostaatbiopten aan te bieden [2, 3]. Risicocalculatoren geven een geïndividualiseerde beoordeling van het potentiële risico op het hebben van met een biopsie detecteerbare (klinisch-significante (cs)) PCa. In Nederland is de meest gebruikte risicocalculator de Rotterdam Prostate Cancer Risk Calculator (RPCRC)-3/4 en de RPCRC-MRI.

Aan de hand van verschillende klinische parameters, zoals het prostaatspecifiek antigeen (PSA), rectaal toucher (RT) en prostaatvolume, kwantificeren de RPCRC-3/4 en de RPCRC-MRI het potentiële risico op (cs)PCa [4,5,6]. Aangezien de RPCRC-MRI ook MRI-bevindingen gebruikt, heeft deze MRI, vergeleken met de RPCRC-3/4, een aangetoond beter onderscheidend vermogen in het vinden van (cs)PCa [7].

De RPCRC-3/4 is ontwikkeld in een screeningspopulatie en wordt door veel urologen gebruikt om te selecteren welke mannen in aanmerking komen voor een MRI. Het verschil tussen de RPCRC‑3 en -4 is dat de eerstgenoemde test bedoeld is voor biopsie-naïeve mannen en de RPCRC‑4 voor mannen met eerdere negatieve prostaatbiopten [6]. De RPCRC-MRI daarentegen is ontwikkeld in een klinisch cohort en wordt gebruikt om mannen na MRI voor prostaatbiopten te selecteren [7].

De positieve invloed van deze risicocalculatoren is reeds bevestigd; gebruik van beide risicocalculatoren kan onnodige MRI-scans en prostaatbiopten bij mannen met een laag risico veilig voorkomen [8,9,10,11]. Patiënten die in de urologische praktijk worden gezien, hebben echter een hoger risico op csPCa. De prestaties en de toepasbaarheid van deze risicocalculatoren in de klinische praktijk worden daarom in twijfel getrokken [12]. Het doel van deze studie is om retrospectief de nauwkeurigheid van zowel de RPCRC-3/4 als de RPCRC-MRI binnen een hedendaags Nederlands klinisch hoogrisicocohort te evalueren.

Materiaal

Een retrospectieve cohortstudie werd uitgevoerd binnen het Prostaatkankernetwerk Nederland, met goedkeuring van de lokale toetsingscommissie (IRBd21-173). Mannen die niet eerder gediagnosticeerd waren met PCa en die tussen januari 2018 en november 2021 prostaatbiopten ondergingen in vier afzonderlijke ziekenhuizen (Spaarne Gasthuis, Noordwest Ziekenhuisgroep, St. Jansdal Ziekenhuis en het Antoni van Leeuwenhoek) vanwege een abnormaal PSA of RT werden geïdentificeerd en geïncludeerd. Gezien de klinische aard van de gegevens en omdat richtlijnen risicostratificatie aanbevelen, ondergingen deze mannen reeds een vorm van risicostratificatie (hetzij via de huidige RPCRC-3/4 en -MRI, hetzij via biomarkertests). Risicostratificatie werd echter meer gebruikt als hulpmiddel bij de besluitvorming dan als besluitvormingsinstrument, aangezien er niet altijd naar de uitkomst van de stratificatie gehandeld werd. De beslissing om een MRI of prostaatbiopten te verrichten, werd in de meeste gevallen genomen op basis van de klinische blik van de uroloog.

Alle mannen ondergingen een MRI voordat prostaatbiopten werden verricht. Deze MRI werd hoofdzakelijk uitgevoerd met een 3,0 Tesla MRI volgens het European Society of Urological Radiology (ESUR) MRI-protocol [13]. Een 1,5 Tesla MRI werd gebruikt in uitzonderlijke gevallen wanneer een 3,0 Tesla MRI was gecontra-indiceerd. Alle MRI’s werden lokaal beoordeeld door ervaren radiologen volgens het gestandaardiseerde Prostate Imaging Reporting and Data System (PI-RADS) classificatie systeem, versie 2.0 [14]. Volgens Nederlandse richtlijnen waren alle radiologen ervaren genoeg om zelfstandig prostaat-MRI’s te beoordelen [15].

Afhankelijk van het ziekenhuis ondergingen mannen ofwel transperineale ofwel transrectale prostaatbiopten. Prostaatbiopten werden uitgevoerd onder plaatselijke verdoving, na een eenmalige dosis antibiotica en na voorbehandeling van de huid met povidonjodium. Alle prostaatbiopten werden uitgevoerd met behulp van cognitieve fusie of MRI/TRUS-fusiesoftware, door urologen met ten minste vijf jaar ervaring in het nemen van prostaatbiopten. Indien een positieve MRI-laesie (gedefinieerd als PI-RADS-classificatie 3–5) zichtbaar was, werden systematische prostaatbiopten voorafgegaan door gerichte prostaatbiopten. Als de MRI een PI-RADS 1- of 2-laesie vertoonde, werd de prostaat enkel systematisch gebiopteerd. Alle biopten werden plaatselijk verwerkt en gerapporteerd volgens het International Society of Urological Pathology (ISUP) protocol, door gespecialiseerde uropathologen met ten minste vijf jaar ervaring in het beoordelen van prostaatbiopten [16]. Het csPCa werd gedefinieerd als ISUP grade group (GG) ≥ 2 (Gleason-score ≥ 3 + 4) [2].

Van alle mannen werden de volgende gegevens verzameld: PSA, klinisch T‑stadium (cT), prostaatvolume, PSA-dichtheid (PSAD), hoogst gerapporteerde PI-RADS-score, het aantal biopten, de wijze van biopteren en de ISUP-gradering van de biopten.

Statistische analyse

De waarschijnlijkheid op PCa en csPCa werd berekend aan de hand van de RPCRC-3/4 en de RPCRC-MRI, met gebruikmaking van de vereiste klinische informatie [5, 7]. Modeldiscriminatie werd onderzocht middels de area under the curve (AUC). De kalibratie verwijst naar de overeenstemming tussen waargenomen en voorspelde uitkomsten, waarbij de mate van het risico op over- of onderschatting van de risicocalculatoren visueel aan de hand van kalibratiecurven werd geëvalueerd en aan de hand van de kalibratiehelling en het intercept werd gekwantificeerd [17]. De kalibratiehelling evalueert de spreiding van de voorspelde risico’s en heeft een streefwaarde van 1; een kalibratiehelling kleiner dan 1 wijst erop dat de voorspelde risico’s te extreem zijn (te hoog voor hoge risico’s én te laag voor lage risico’s), terwijl een kalibratiehelling groter dan 1 erop wijst dat risico’s te gematigd zijn. Het intercept geeft aan of de voorspellingen systematisch overschatten (negatieve waarden) of onderschatten (positieve waarden). Als de helling dicht bij 1 ligt en het intercept dicht bij 0, is er sprake van een goede kalibratie [18]. De klinische utiliteit van de risicocalculatoren werd geëvalueerd door middel van decision curve analysis (DCA) om antwoord te geven op de vraag vanaf welke risicodrempels het model meerwaarde heeft vergeleken met het biopteren van iedereen [17, 19]. Wij beoordeelden het theoretische aantal gemiste csPCa-diagnoses en het theoretische aantal vermeden MRI’s/biopten en ciPCa-diagnoses.

Om rekening te houden met het verschil in setting (de RPCRC is immers gebaseerd op een screeningspopulatie, terwijl dit validatiecohort een hedendaagse klinische populatie vertegenwoordigt), hebben we de risicocalculatoren opnieuw gekalibreerd door middel van interceptaanpassingen [18]. Alle statistische analyses werden uitgevoerd met behulp van R versie 4.1.0.

Resultaten

We includeerden 1.575 patiënten van wie 306/1.575 (19,4 %) transrectale prostaatbiopten ondergingen en 1269/1.575 (80,6 %) transperineale prostaatbiopten. Cognitieve fusie en MRI/TRUS-fusiesoftware werden respectievelijk bij 1.189/1.575 (75,5 %) en 386/1.575 (24,5 %) mannen toegepast. Patiëntkarakteristieken staan vermeld in tab. 1. De mediane leeftijd was 67 jaar (interkwartielbereik (IQR) 61–72), de mediane PSA 7,6 ng/ml (IQR 5,3–11,3), het mediane prostaatvolume 46 ml (IQR 35–65) en de mediane PSAD 0,16 ng/ml/cm3 (IQR 0,11–0,25). De meerderheid van de mannen, 1.057/1.575 (67,1 %), had een onverdacht RT. PI-RADS 3, 4 en 5 afwijkingen op MRI werden respectievelijk waargenomen bij 331/1.575 (21,0 %), 557/1.575 (35,4 %) en 511/1.575 (32,4 %) mannen.

Tabel 1 Patiëntkarakteristieken van ons validatiecohort. Continue variabelen: mediaan met interkwartielbereik; categoriale variabelen: aantallen met percentages. Data originele RPCRC-3/4- en RPCRC-MRIcohorten zijn illustratief

In totaal werden 996/1.575 (63,2) mannen gediagnosticeerd met PCa, van wie 340/1.575 (21,6 %) met ciPCa en 656/1.575 (41,7 %) met csPCa.

Validatie RPCRC-3/4

De AUC van de RPCRC-3/4 bedroeg respectievelijk 0,73 (95 %-BI 0,70–0,75) en 0,75 (95 %-BI 0,72–0,77) voor PCa en csPCa. De RPCRC-3/4 vertoonde onderschatting van het risico op zowel PCa als csPCa. De kalibratiehelling en het intercept voor het voorspellen van PCa waren respectievelijk 0,71 (95 %-BI 0,60–0,81) en 1,54 (95 %-BI 1,43–1,66). Voor het voorspellen van csPCa waren de kalibratiehelling en het intercept respectievelijk 0,57 (95 %-BI 0,49–0,64) en 1,64 (95 %-BI 1,52–1,77). Na herkalibratie verandert de kalibratiehelling per definitie niet, maar het intercept wel; het intercept voor zowel het voorspellen van PCa als csPCa werd op nul gesteld. De kalibratiecurves voor zowel de originele (oftewel de niet-gekalibreerde, op een screeningspopulatie gebaseerde risicocalculator) als de opnieuw gekalibreerde RPCRC-3/4 zijn in weergegeven in fig. 1.

Figuur 1
figure 1

Kalibratiecurves van de originele en de opnieuw gekalibreerde RPCRC-3/4. Het aantal patiënten met en zonder (cs)PCa is weergeven als spikes langs de x‑as. csPCa klinisch-significante PCa, MRI magnetic resonance imaging, PCa prostaatkanker, RPCRC Rotterdam Prostate Cancer Risk Calculator

Validatie RPCRC-MRI

De AUC van de RPCRC-MRI bedroeg respectievelijk 0,76 (95 %-BI 0,74–0,79) en 0,79 (95 %-BI 0,77–0,81) voor PCa en csPCa. Herkalibratie was niet noodzakelijk, aangezien er geen substantiële over- of onderschatting werd gezien. De kalibratiehelling en het intercept voor het voorspellen van PCa waren respectievelijk 0,66 (95 %-BI 0,57–0,74) en 0,23 (95 %-BI 0,10–0,35). Voor het voorspellen van csPCa waren de kalibratiehelling en het intercept respectievelijk 0,78 (95 %-BI 0,69–0,87) en −0,21 (95 %-BI −0,33–−0,09). De kalibratiecurves voor de RPCRC-MRI zijn in fig. 2 weergegeven.

Figuur 2
figure 2

Kalibratiecurves van de RPCRC-MRI. Het aantal patiënten met en zonder (cs)PCa is weergeven als spikes langs de x‑as. csPCa klinisch-significante PCa, MRI magnetic resonance imaging, PCa prostaatkanker, RPCRC Rotterdam Prostate Cancer Risk Calculator

Decision curve analysis

De decision curves zijn weergegeven in fig. 3. Het gebruik van de originele RPCRC-3/4 met de huidige risicodrempels (20 % voor PCa en 4 % voor csPCa), had 37,3 % (587/1.575) van de MRI’s en 39,1 % (133/340) van de ciPCa-diagnoses kunnen voorkomen. Dan zou echter 18,3 % (120/656) van de csPCa-diagnoses zijn gemist. Na herkalibratie werd er nog maar een minimale klinische utiliteit waargenomen ten opzichte van het biopteren van iedereen bij gebruikmaking van de oorspronkelijke risicodrempels, namelijk: 2,7 % (43/1.575) van de MRI’s zou worden bespaard, 2,6 % (9/340) van ciPCa-diagnoses zou worden voorkomen en 0,6 % (4/656) van de csPCa-diagnoses zou worden gemist.

Figuur 3
figure 3

Decision curve analysis van de (geherkalibreerde) RPCRC-3/4 en RPCRC-MRI. a Decision curve analysis aangaande de detectie van PCa, b decision curve analysis aangaande de detectie van csPCa. csPCa klinisch-significante PCa, MRI magnetic resonance imaging, PCa prostaatkanker, RPCRC Rotterdam Prostate Cancer Risk Calculator

Om een optimale prestatie van de risicocalculator te bewerkstelligen, werden risicodrempels bijgesteld naar 20 % voor PCa en 10 % voor csPCa. De opnieuw gekalibreerde RPCRC-3/4, gebruikmakend van deze risicodrempels, zou 15,1 % (238/1.575) van de MRI’s kunnen besparen en 14,1 % (48/340) van de ciPCa-diagnoses kunnen voorkomen. Tegelijkertijd zou nu maar 5,3 % (35/656) van de csPCa-diagnoses worden gemist.

De RPCRC-MRI presteerde goed en de risicodrempels hoefden niet te worden aangepast. Bij gebruik van de huidige risicodrempels (20 % voor PCa en 4 % voor csPCa), zou 10,7 % (169/1.575) van de biopten worden voorkomen, waarbij 1,2 % (8/656) van de csPCa-diagnoses zou worden gemist.

Discussie

Op basis van onze bevindingen is gebruik van de RPCRC-3/4 suboptimaal voor risicostratificatie in een klinisch hoogrisicocohort en lijkt herkalibratie aan de hand van klinische data noodzakelijk; te veel mannen worden op basis van de RPCRC-3/4 ten onrechte als laagrisico gestratificeerd. Risicostratificatie middels de RPCRC-MRI is daarentegen wel geschikt gebleken voor gebruik in een klinisch (hoogrisico)cohort.

Onze bevindingen worden onderschreven door reeds eerder uitgevoerde Nederlandse studies [20, 21]. Gebruik van de RPCRC-3/4 als een stratificatiemethode voorafgaand aan het uitvoeren van MRI-scans gaat ten koste van een aanzienlijk deel van de csPCa-diagnoses [20]. De suboptimale risicostratificatie van de RPCRC-3/4 kan worden verklaard door een verschil in de patiëntenpopulatie waarop de risicocalculatoren zijn gebaseerd. Mannen in een screeningspopulatie hebben a priori een lagere waarschijnlijkheid om (cs)PCa te hebben dan mannen in een klinische populatie [22]. Daarom onderschat het gebruik van de RPCRC-3/4 in het diagnostische proces van klinisch verdachte mannen de kans op het detecteren van (cs)PCa [21]. Daarnaast zijn mannen in deze screeningspopulatie enkel systematisch gebiopteerd, wat de detectie van (cs)PCa kan hebben beïnvloed; een combinatie van gerichte en systematische biopten heeft een bewezen betere detectie van csPCa [23].

Dit is echter in tegenspraak met een eerdere validatiestudie van Gayet et al. binnen een Nederlands klinisch cohort waarin een uitstekende kalibratie voor de RPCRC-3/4 in een biopsienaïeve klinische populatie werd gezien [24]. Mogelijke verklaringen voor deze tegenstrijdigheid kunnen gevonden worden in het biopsieprotocol en de voorselectie van patiënten in onze studie. In tegenstelling tot ons cohort werd er bij de patiënten van Gayet et al. voorafgaand aan prostaatbiopten geen MRI verricht en werden uitsluitend systematische prostaatbiopten afgenomen. Hoewel patiëntkarakteristieken vergelijkbaar waren, kunnen deze verschillen gedeeltelijk hun significant lagere (cs)PCa detectieratio’s (44,1 % had PCa en 20,3 % had csPCa) verklaren [23]. Aangezien in ons huidige validatiecohort de detectiegraad van PCa hoger was, is het a priori-risico eveneens hoger dan dit risico in het validatiecohort van Gayet et al. Verschillen in a priori-risico’s van de populaties maken het mogelijk dat deze twee studies tegenstrijdige bevindingen hebben.

Het gebruik van risicostratificatie voorkomt onnodige MRI’s en prostaatbiopten, en vermindert het aantal ciPCa-diagnoses, maar mist enkele gevallen van csPCa [22]. Er moet een evenwicht worden gevonden tussen het maximaliseren van de detectie van csPCa en het minimaliseren van zowel het aantal prostaatbiopten als de detectie van ciPCa. De klinische impact van het missen van enkele csPCa-diagnoses op uiteindelijke metastasering en mortaliteit is onbekend. Men zou zelfs kunnen stellen dat er bij mannen met een klinische verdenking op (cs)PCa geen sprake is van het missen van csPCa, alleen van het uitstellen van de diagnose; mannen zullen immers op basis van hun klinische verdenking worden vervolgd. Follow-up zou het probleem van het missen van een tijdige csPCa-diagnose kunnen ondervangen, aangezien risicostratificatie in de loop van de tijd zal veranderen als gevolg van tumorprogressie en verandering van klinische eigenschappen, zoals PSA.

De huidige studie heeft enkele limitaties. Ten eerste is de opzet van deze externe validatie retrospectief van aard. Retrospectieve studies staan bekend om hun risico op selectiebias. Voordat MRI’s en prostaatbiopten werden uitgevoerd, werd in de vier ziekenhuizen reeds risicostratificatie toegepast; hetzij via de huidige niet-gekalibreerde risicocalculatoren, hetzij via andere methoden. Hoewel deze risicostratificatie niet als besluitvormingsinstrument werd gebruikt, heeft de risicostratificatie ons cohort wel kunnen beïnvloeden en moeten bevindingen met de nodige voorzichtigheid worden geïnterpreteerd. Ten tweede kon de ervaring van beoordelend radiologen niet precies worden vastgesteld. Hoewel de radiologen ervaren genoeg waren om onafhankelijk prostaat-MRI’s te beoordelen, is het onduidelijk of zij allemaal experts waren. Derhalve kan worden getwijfeld aan de kwaliteit van de MRI-beoordelingen en aan de toegekende PI-RADS-classificatie. Daarnaast verschilde de biopsiebenadering tussen de vier centra: patiënten ondergingen – afhankelijk van het centrum – gerichte, systematische of gecombineerde prostaatbiopten, transrectaal of transperineaal waarbij ofwel cognitieve ofwel softwarematige fusietechnieken werden gebruikt. Hoewel de detectie van csPCa vergelijkbaar bleek voor zowel transrectale en transperineale benaderingen als voor cognitieve en softwarematige fusietechnieken, op voorwaarde dat de ervaring en vaardigheden van de uroloog adequaat waren, was dit niet het geval voor de verschillende biopsietemplates [25,26,27,28,29]. Ondanks het feit dat alle geïncludeerde ziekenhuizen grote diagnostische of chirurgische PCa-centra waren, kunnen verschillen in biopsieprotocollen en -technieken onze gegevens en, bijgevolg, onze bevindingen hebben beïnvloed. Gezien bovenstaande moeten de bevindingen van deze studie met een zekere mate van voorzichtigheid worden geïnterpreteerd.

Conclusie

In een hedendaags klinisch hoogrisicocohort is geïndividualiseerde risicostratificatie een uitdaging. De huidige RPCRC-3/4 onderschat het risico op csPCa binnen zo’n cohort, waardoor aanzienlijke aantallen csPCa-diagnoses worden gemist. Hoewel het gebruik van de RPCRC-3/4 in een populatie met een lager risico zijn waarde heeft bewezen, wordt geadviseerd om de RPCRC-3/4 in een populatie met een hoger risico met voorzichtigheid te gebruiken. Ook al is de RPCRC-3/4 reeds aangepast, het is nog altijd van essentieel belang om de prestaties van de RPCRC-3/4 binnen de te onderzoeken populatie te evalueren, alvorens deze risicocalculator in de eigen kliniek te implementeren. Gezien de retrospectieve aard van deze studie moeten de bevindingen met een zekere voorzichtigheid worden geïnterpreteerd en worden prospectieve studies aanbevolen om onze bevindingen te onderbouwen.