Introduzione

Qualche anno fa, due Editoriali dedicati all’appropriatezza hanno chiarito che praticare l’appropriatezza in Medicina di Laboratorio è complesso, perché il concetto è elusivo anche se è andato maturando nel tempo, perché non sempre sono “evidenti” o robusti i fondamenti EBLM su cui si dovrebbero costruire i criteri [1] e perché gli strumenti d’implementazione sono multifattoriali e richiedono continuità e attenta verifica, e, inoltre, hanno suggerito una sorta di vademecum (Tab. 1) [2]. Recentemente la letteratura ha offerto nuovi elementi interessanti, in relazione ai fondamenti evidence-based dell’appropriatezza, al concetto di appropriatezza declinato per tutto il processo diagnostico (TTP) e agli strumenti di implementazione pratica, a partire dalle definizioni più recenti di appropriatezza di un esame diagnostico come ciò che fornisce una risposta al quesito clinico e quindi consente una decisione a cui consegue un trattamento [3] e che è misurata come informazione che determina esiti rilevanti per il paziente [4].

Tabella 1 Vademecum per l’implementazione di percorsi di appropriatezza in Medicina di Laboratorio

Appropriatezza ed EBLM

Il legame tra appropriatezza ed esiti clinici, messo in risalto dalle definizioni appena ricordate e legato al cambiamento da “essenzialista” a “consequenzialista” della Medicina di Laboratorio [5], implica che il fondamento dell’appropriatezza in Medicina di Laboratorio sia l’EBLM, evitando il rischio di soggettività messo in luce da Smellie nel suo Appropriateness of test use in pathology: a new era or reinventing the wheel? [6].

Il criterio di riferimento per l’appropriatezza diventa, quindi, l’aderenza alle linee guida. Nella ricerca del 2014 di Hauser e Shirts [7], l’84,5% dei criteri di appropriatezza riposavano, appunto, su linee guida clinico-organizzative nazionali (governo, Società scientifiche), locali o da letteratura.

Un’immediata conseguenza è che l’inappropriatezza non è solo eccesso di test, come superficialmente dedotto dal lavoro di van Walrawen e Naylor [8], ma anche sottoutilizzo o errata interpretazione dei risultati [5]. Da questo punto di vista i pochi lavori disponibili in letteratura sono stati irrobustiti dalla metanalisi sulle ricerche dei 15 anni (1997–2012) successivi alla ricerca di van Walraven e Naylor, eseguita da Zhi et al [9], che mostra un tasso medio di sovrautilizzo del 20,6% (IC 95% 16,2–24,9%), ma un tasso medio di sottoutilizzo del 44,8% (IC 95% 33,8–55,8%). Il valore cumulativo d’inappropriatezza si situa, dunque, intorno a quel 33% stimato in precedenza, ma per effetto di un sottoutilizzo doppio del sovrautilizzo.

È tuttavia noto che le evidenze in Medicina di Laboratorio sono meno forti che in campo terapeutico, per la carenza di studi primari e la debolezza delle ricerche sistematiche e delle metanalisi, per le ragioni elencate da Bruns [10] ancora nel 2001. Per questo il Report 2009 del Lewin Group [11] ha sancito che gli studi clinici randomizzati (RCT) non dovrebbero essere utilizzati nelle ricerche di efficacia comparata in Medicina di Laboratorio. Il problema chiave è la distanza spazio-temporale tra esame diagnostico ed esiti nel decorso della malattia, pertanto si suggerisce di utilizzare studi di accuratezza diagnostica secondo i recentemente rinnovati standard STARD [12] e QUADAS [13] oppure si è costretti a utilizzare ancora processi di consenso come “gruppi nominali”, “consensus conference” o metodi “Delphi” più o meno semplificati [1].

Nonostante ciò, le linee guida non riescono a coprire tutta la realtà operativa. Per l’ematologia di laboratorio, per esempio, nel 2006 [14] le 88 evidenze dell’EBLM-Commission di IFCC erano relative alla coagulazione (53%), 22% ai leucociti (di cui metà per sepsi e metà per sottopopolazioni linfocitarie), 19% a eritrociti ed emoglobina e 6% a piastrine e nel 2015 [15] le 64 linee guida per l’ematologia di laboratorio in PubMed e altri siti davano risultati simili: 40% coagulazione, 26,4% leucociti (circa 60% per citofluorimetria), 14,7% per emoglobinopatie e altre anomalie eritrocitarie e 5,9% piastrine. Produrre evidenze e linee guida è, dunque, un campo necessario ed eccitante per la Medicina di Laboratorio [16], tenendo conto che poco più del 20% delle linee guida generali comprende nel suo gruppo di ricerca anche un professionista di laboratorio [7].

Appropriatezza e TTP

Più di dieci anni fa il GdS E SIMeL [14] affermava che l’appropriatezza è un predicato di ogni fase del TTP, se si vuol essere conseguenti alle definizioni di appropriatezza prima ricordate. Oggi pare che il concetto sia stato largamente accettato sia teoreticamente sia praticamente.

La Task Force IFCC sull’impatto della Medicina di Laboratorio sulla gestione clinica e sugli esiti [17], citando le cinque vie con cui può avverarsi un errore diagnostico [18], esplicita la necessità di controllare tutti i passaggi del TTP. D’altro canto Fryer e Smellie [19], nel loro “toolkit” per l’appropriatezza degli esami di laboratorio, suggeriscono 27 raccomandazioni non solo focalizzate alla selezione dei test ma anche alla fase pre-preanalitica (condividere la strategia con i clinici) e preanalitica (prelievo e caratteristiche del campione), postanalitica (referto interpretativo) e post-postanalitica (audit), con particolare enfasi sull’impatto delle richieste computerizzate e delle esigenze dei pazienti.

Ciò apre un ulteriore campo all’attività dei professionisti del laboratorio [16]. Le linee guida cliniche non trattano di solito gli aspetti considerati laboratoristici: solo in un terzo dei casi sono presenti le necessarie informazioni riguardo lo stato dei pazienti, le interferenze biologiche e analitiche e il trattamento dei campioni [7]. L’inserimento di uno specialista di laboratorio nei comitati/gruppi di preparazione di linee guida cliniche, però, migliora la situazione, rendendole esaustive sotto il profilo dei mezzi diagnostici in circa la metà dei casi [7].

Tuttavia, la gran parte della letteratura sull’appropriatezza è ancora dedicata alla selezione dei test, sotto il nome di “laboratory utilization management” o più precisamente “demand management” se focalizzata all’appropriatezza e “demand control” se riferita al contenimento del numero delle richieste [20]. Buone revisioni di letteratura, dal punto di vista anglosassone e americano, sono comparse a cura di Smellie [21] e di Huck e Lewandroski [22].

Praticare l’appropriatezza

Le conclusioni di Solomon et al [23] sui modi di implementare regole di appropriatezza sono state ancora recentemente confermate da una revisione sistematica su 109 lavori selezionati dai 3236 raccolti nell’arco degli anni 1946–2013 [24]: la strategia migliore è multifattoriale e prolungata e comprende un intelligente mix di educazione, cambiamenti amministrativi del disegno/modo di richiesta e feedback e/o audit. Inoltre il supporto degli opinion leader nei gruppi clinici e dell’alta dirigenza ai gruppi multidisciplinari è cruciale per il successo delle iniziative [20]. Tuttavia la qualità dei lavori di letteratura è bassa e l’eterogeneità è molto elevata, quindi i suggerimenti devono essere cercati nelle singole esperienze [24].

Tra le diverse strategie proposte per modificare il comportamento dei clinici, negli anni recenti due novità hanno fatto intravvedere positive possibilità di successo: i CCDSS (Computerized Clinical Decision Support Systems), di cui abbiamo già parlato [2], e l’iniziativa Choosing Wisely [25].

Per quanto riguarda i primi si vanno accumulando dati sull’efficacia dei sistemi che allertano o bloccano i richiedenti in base a regole di contesto o di ripetizione. Secondo recenti dati americani [26], i sistemi di blocco sono più efficienti di quelli di allerta, almeno per quel che riguarda le richieste duplicate (92,3% contro 42,6%). Più articolata la situazione italiana. Il Progetto ERMETE della Regione Veneto, ora all’esame del Ministero della salute, si basa sul GOELM DSS (Guide Order Entry Laboratory Medicine—Decision Support System), un modello a razionalità limitata che propone alcune opzioni e suggerisce alcune indicazioni per la richiesta dei test, ma non impone o blocca scelte. Nel 2010 due esperimenti con complessivi 219 medici di medicina generale (MMG) su 110 test hanno raggiunto riduzioni cumulative del 26% e 38% rispettivamente [27]. Il Progetto AdeR dell’Area Vasta Romagna utilizza un software di 128 regole che consente o blocca la richiesta di test ed è stato testato dal 2010 in 7 ospedali su 18 esami selezionati (AST/ALT; urea/creatinina; VES/CRP; marcatori tumorali; HbA1c; elettroforesi proteica). Nel 2015 la richiesta per i test sopra ricordati è diminuita tra il 45,4% e il 93,9% con l’unica crescita della CRP (+38%) contro una diminuzione della VES del 93,9% [28]. L’implementazione dei due sistemi è stata preceduta da un’intensa attività educativa e accompagnata da regolari feedback. Al di là delle differenze nella tipologia (MMG vs medici ospedalieri) e nel numero di medici coinvolti (219 vs ≈1000), nel numero dei test selezionati (110 vs 18) e nelle caratteristiche degli strumenti (allerta vs blocco), entrambi i sistemi dimostrano che il mix di fattori predisponenti, abilitanti e rinforzanti funziona.

Choosing Wisely [25] è un’iniziativa lanciata nel 2012 da ABIM (American Board of Internal Medicine) con l’obiettivo di evitare test, trattamenti e procedure inutili sulla base di raccomandazioni espresse dalle Società scientifiche in maniera sintetica “The Top Five List” (le 5 cose da non fare), una lista di cinque esami diagnostici o trattamenti che abbiano come caratteristiche di essere tra i più costosi, di esporre i pazienti a rischi e non apportare benefici significativi. L’iniziativa si è diffusa nel mondo e la sezione italiana Choosing Wisely—Slow Medicine [29] comprende ora più di 40 Società scientifiche, inclusa SIPMeL, e più di 10 organizzazioni professionali. I due aspetti salienti dell’iniziativa sono, dal lato professionale, il suggerimento di raccomandazioni veloci e facilmente memorizzabili, piuttosto che le lunghe e complicate linee guida spesso aggiornate e riaggiornate, che sono molto più gradite alla maggior parte dei medici e, dal lato dei pazienti, il concorso nell’implementazione di coalizioni di associazioni di pazienti e consumatori che ne garantiscono la diffusione e l’accettazione, superando la percezione di ingiustificati razionamenti di cure [19]. La SIPMeL ha presentato una lista generale (Tab. 2) e il GdS Endocrinologia e Malattie del Metabolismo, per primo, ha preparato un’altra specifica lista che si riferisce alla diagnostica ottimale della funzionalità tiroidea, della sindrome di Cushing, del feomocromocitoma, di tireopatia autoimmune e alla determinazione della 25 (OH) vitamina D [30].

Tabella 2 “Top five list” di SIPMeL per Choosing Wisely—Slow Medicine

Conclusioni

In un periodo storico contrassegnato dalla necessità del contenimento dei costi ma anche dall’esigenza di un’attenzione maggiore alla qualità ed efficacia delle cure [31], spesso le scelte di “appropriatezza” si risolvono in interventi di razionamento, calati dall’alto, che possono sì avere effetti finanziari, ma aprono molti dubbi circa l’appropriatezza vera delle cure, lasciando possibile campo al sottoutilizzo di trattamenti efficaci [32]. Pur non negando la necessità di maggiore attenzione ai modi concreti di attuare il principio “less is more”, una riflessione collettiva (professionisti, decisori e stakeholders in primis, pazienti e cittadini) sulle “evidenze” di letteratura, sui modi già testati anche in Italia di praticare l’appropriatezza e sulle capacità della Società scientifiche come SIPMeL di individuare linee guida corrette ed efficaci dovrebbe essere il viatico necessario per qualsiasi intervento locale e nazionale. Sarebbe ora che dalla “evidence-based medicine” si raggiungesse quella che Matthew McQueen [33] chiamava già 15 anni fa “evidence-driven health management and public policy”: “The ultimate challenge may be to recognize openly the political uses and misuses of evidence and to extend rules of evidence to government policy”.