Perché si dovrebbe essere attenti con composito risultati di studi clinici
Un “endpoint composito” è quando i ricercatori in uno studio clinico a decidere di combinare diversi risultati misurabili in un unico risultato.
Ecco un esempio del mondo reale da 2018, di un farmaco per malattie cardiache chiamato Repatha, realizzato dalla società farmaceutica Amgen. I risultati compositi sono in grassetto:
“Amgen ha annunciato che lo studio di FOURIER che valuta se Repatha riduce il rischio di eventi cardiovascolari ha soddisfatto il suo endpoint composito primario (morte cardiovascolare, infarto miocardico non fatale (MI), ictus non fatale, ospedalizzazione per angina instabile o rivascolarizzazione coronarica).”
I risultati compositi sono comunemente usati negli studi che testano nuovi trattamenti per le malattie cardiovascolari, ma possono essere trovati attraverso la ricerca medica. Uno studio può esaminare come un singolo intervento ha influenzato diverse cose, come ad esempio:
- frequenza di infarto, ictus o morte improvvisa.
- tasso di morte o malattia polmonare cronica nei neonati pretermine
- tasso di rigetto d’organo completo o parziale nei trapianti
L’utilizzo di risultati compositi ha i suoi vantaggi e svantaggi, ma per i giornalisti e i consumatori di notizie, è bene essere cauti ogni volta che li si incontra.
Perché utilizzare i risultati compositi negli studi clinici?
Il principale vantaggio di questo approccio è una maggiore efficienza statistica. Misurando più di un risultato e combinando i dati in un singolo risultato, i ricercatori hanno un tempo più facile che mostra una differenza statisticamente significativa tra il gruppo di trattamento e i controlli. Ciò consente studi che richiedono meno pazienti, richiedono meno tempo e, in definitiva, sono più convenienti.
Tuttavia, questo approccio può anche aprire la porta a depistaggi e giochi di prestigio statistici.
Un modo in cui questo può accadere è combinando componenti con diversa importanza clinica. Come ha notato Gloria Cordoba, dell’Università di Copenaghen, e colleghi in un’analisi BMJ, tali combinazioni possono far sembrare un trattamento più efficace di quanto non sia in realtà:
Ad esempio, supponiamo che un farmaco porti ad una grande riduzione di un risultato composito di “morte o dolore toracico.”Questa scoperta potrebbe significare che il farmaco ha provocato meno morti e meno dolore al petto. Ma è anche possibile che il composito sia stato guidato interamente da una riduzione del dolore toracico senza alcun cambiamento, o addirittura un aumento, della morte.
Implicazioni fuorvianti
Per aiutare i lettori a capire quali componenti del composito sono più responsabili di qualsiasi effetto del trattamento, molti esperti sottolineano l’importanza di presentare i dati per tutti i componenti compositi negli studi di ricerca pubblicati.
Ma nella loro revisione sistematica di 40 studi randomizzati, Cordoba et al hanno scoperto che solo il 60% degli studi che hanno esaminato ha fornito stime affidabili per tutti i componenti compositi. In molti studi, c’era un’implicazione fuorviante che i risultati si applicavano alla componente clinica più importante del composito, quando i risultati erano principalmente attribuibili a componenti meno gravi.
Alcuni materiali compositi sono basati su “richiami di giudizio”
Ecco un’altra preoccupazione per i materiali compositi: molti studi utilizzano componenti, come i ricoveri ospedalieri, che si basano su una chiamata di giudizio fatta dai medici che conducono lo studio. E questi sono spesso i componenti del composito che mostrano l’effetto più grande e contribuiscono maggiormente a un risultato complessivamente positivo.
I ricercatori di un importante studio clinico finanziato dal NIH hanno recentemente affrontato critiche per aver aggiunto questi risultati di “giudizio” al loro studio dopo che era già in corso.
Questo è problematico, nota Cordoba e colleghi, perché i medici spesso non sono accecati al trattamento che i pazienti in studio stanno ricevendo (cioè sanno se il paziente è nel gruppo di trattamento sperimentale o nel gruppo placebo/controllo). E così il loro giudizio in questi casi potrebbe facilmente essere distorto dalla loro conoscenza dell’allocazione del gruppo di studio del paziente.
Non sorprende che gli studi che includono tali componenti “guidati da medici” abbiano maggiori probabilità di riportare un risultato statisticamente significativo per l’esito primario.
Lo spostamento degli endpoint può portare a dati raccolti da cherry
Un avviso finale riguarda gli studi che “cherry pick” dati da includere nel composito. Quando i componenti del composito non sono chiaramente identificati prima dello studio, i ricercatori possono essere tentati di mescolare e abbinare i componenti del risultato fino a quando non arrivano a un risultato statisticamente significativo (qualcosa che è destinato ad accadere alla fine a causa del caso). In uno studio individuato da Cordoba et al, il risultato primario era un composto di 8 componenti diversi che non era statisticamente significativo. Tuttavia, gli autori hanno anche riportato su una serie di compositi secondari che consistevano in “combinazioni di punti finali primari e morte per qualsiasi causa.”
Queste combinazioni non sono state specificate nello studio, ma Cordoba ha calcolato 502 modi in cui questi componenti potevano essere combinati. Non è uno shock che i ricercatori alla fine abbiano ottenuto un risultato statisticamente significativo per una di queste combinazioni—una scoperta che è stata individuata per l’enfasi nell’abstract dello studio, ma che è di incerta importanza clinica.
Bottom line
Dobbiamo stare attenti quando riportiamo studi che utilizzano risultati compositi. Quando questi studi riportano un beneficio, i reporter dovrebbero valutare se c’è stato un effetto simile su tutti i componenti del composito; in caso contrario, dovrebbero identificare quale componente del composito è stato il principale responsabile del risultato e spiegare se tale componente è più o meno importante degli altri. Prestare particolare attenzione quando il componente richiede una chiamata di giudizio da parte del clinico (ad esempio ricoveri ospedalieri, rinvio per un intervento chirurgico, inizio di nuovi antibiotici), poiché queste misure hanno maggiori probabilità di mostrare un risultato positivo che può riflettere pregiudizi da parte dei ricercatori.
Infine, è anche importante verificare se i componenti del composito sono stati determinati prima dell’inizio dello studio (a priori) o dopo che è stato completato (post hoc). Questo può spesso essere raccolto da un’attenta lettura dello studio stesso o controllando il suo elenco di registro (se esiste) a clinicaltrials.gov.
I registri di prova forniscono un record di quali risultati sono stati specificati prima dell’inizio dello studio, in modo che i ricercatori non possano decidere in seguito di scegliere altri risultati che mostrassero un beneficio. Le modifiche post hoc ai componenti compositi dovrebbero generalmente essere viste con scetticismo.
torna a “Suggerimenti per la comprensione degli studi”