hvorfor du skal være forsigtig med sammensatte resultater i kliniske forsøg
et “sammensat endepunkt” er, når forskere i et klinisk forsøg beslutter at kombinere flere målbare resultater i et enkelt resultat.
her er et eksempel fra den virkelige verden fra 2018 af et hjertesygdomsmedicin kaldet Repatha, lavet af lægemiddelfirmaet Amgen. De sammensatte resultater er fed:
“Amgen meddelte, at FOURIER-forsøget, der vurderede, om Repatha reducerer risikoen for kardiovaskulære hændelser, opfyldte sit primære sammensatte endepunkt (kardiovaskulær død, ikke-dødelig myokardieinfarkt (MI), ikke-dødelig slagtilfælde, indlæggelse for ustabil angina eller koronar revaskularisering).”
sammensatte resultater bruges ofte i undersøgelser, der tester nye behandlinger for hjerte-kar-sygdomme, men de kan findes på tværs af medicinsk forskning. En undersøgelse kan se på, hvordan en enkelt intervention påvirkede flere ting, såsom:
- hyppighed af hjerteanfald, slagtilfælde eller pludselig død.
- dødsrate eller kronisk lungesygdom hos premature babyer
- sats for fuldstændig eller delvis organafstødning i transplantationer
brug af sammensatte resultater har sine fordele og ulemper, men for journalister og nyhedsforbrugere er det godt at være forsigtig, når som helst du støder på dem.
Hvorfor bruge sammensatte resultater i kliniske forsøg?
den største fordel ved denne fremgangsmåde er øget statistisk effektivitet. Ved at måle mere end et resultat og kombinere dataene i et enkelt resultat har forskere lettere ved at vise en statistisk signifikant forskel mellem behandlingsgruppen og kontrollerne. Dette giver mulighed for undersøgelser, der kræver færre patienter, tager mindre tid og i sidste ende er mere omkostningseffektive.
denne tilgang kan dog også åbne døren for vildledning og statistisk håndsving.
en måde dette kan ske på er ved at kombinere komponenter med varierende klinisk betydning. Som Gloria Cordoba fra Københavns Universitet og kolleger bemærkede i en BMJ-analyse, kan sådanne kombinationer få en behandling til at virke mere effektiv, end den virkelig er:
Antag for eksempel, at et lægemiddel fører til en stor reduktion i et sammensat resultat af “død eller brystsmerter.”Dette fund kan betyde, at stoffet resulterede i færre dødsfald og mindre brystsmerter. Men det er også muligt, at kompositmaterialet udelukkende blev drevet af en reduktion i brystsmerter uden ændring eller endog en stigning i døden.
vildledende implikationer
for at hjælpe læserne med at forstå, hvilke komponenter i kompositmaterialet der er mest ansvarlige for enhver behandlingseffekt, understreger mange eksperter vigtigheden af at præsentere data for alle kompositkomponenter i offentliggjorte forskningsundersøgelser.
men i deres systematiske gennemgang af 40 randomiserede forsøg fandt Cordoba et al., at kun 60% af de undersøgelser, de så på, leverede pålidelige estimater for alle sammensatte komponenter. I mange undersøgelser var der en vildledende implikation af, at resultaterne gjaldt for den vigtigste kliniske komponent i kompositmaterialet, når resultaterne primært kunne henføres til mindre alvorlige komponenter.
nogle kompositter er baseret på ‘dom opkald’
her er en anden bekymring med kompositter: mange undersøgelser bruger komponenter, såsom hospitalsindlæggelser, der er baseret på en dom opkald foretaget af klinikerne gennemføre undersøgelsen. Og det er ofte de komponenter i kompositmaterialet, der viser den største effekt og bidrager mest til et generelt positivt resultat.
forskere på et større NIH-finansieret klinisk forsøg stod for nylig over for kritik for at tilføje disse “domskald” – resultater til deres undersøgelse, efter at den allerede var i gang.
dette er problematisk, bemærker Cordoba og kolleger, fordi klinikere ofte ikke er blinde for den behandling, som studiepatienter får (dvs.de ved, om patienten er i den eksperimentelle behandlingsgruppe eller placebo/kontrolgruppen). Og så kunne deres vurdering i disse tilfælde let være forudindtaget af deres viden om patientens studiegruppetildeling.
ikke overraskende er undersøgelser, der inkluderer sådanne “klinikerdrevne” komponenter, mere tilbøjelige til at rapportere et statistisk signifikant resultat for det primære resultat.
skiftende endepunkter kan føre til kirsebærplukkede data
en sidste advarsel involverer undersøgelser, der “kirsebærplukker” data, der skal medtages i kompositten. Når komponenterne i kompositmaterialet ikke er klart identificeret før undersøgelsen, kan forskere blive fristet til at blande og matche resultatkomponenter, indtil de når frem til et statistisk signifikant resultat (noget der sandsynligvis vil ske i sidste ende på grund af tilfældigheder). I en undersøgelse udpeget af Cordoba et al, det primære resultat var en sammensætning af 8 forskellige komponenter, der ikke var statistisk signifikante. Imidlertid, forfatterne rapporterede også om et antal sekundære kompositter, der bestod af “kombinationer af primære slutpunkter såvel som død af enhver årsag.”
disse kombinationer blev ikke specificeret i undersøgelsen, men Cordoba beregnet 502 måder, hvorpå disse komponenter kunne kombineres. Det er ikke noget chok, at forskerne i sidste ende viste et statistisk signifikant resultat for en af disse kombinationer—Et fund, der blev udpeget til vægt i undersøgelsesabstraktet, men som er af usikker klinisk betydning.
Bottom line
vi skal være forsigtige, når vi rapporterer om undersøgelser, der bruger sammensatte resultater. Når disse undersøgelser rapporterer en fordel, bør journalister vurdere, om der var en lignende effekt på alle komponenter i kompositmaterialet; hvis ikke, skal de identificere, hvilken komponent af kompositmaterialet der primært var ansvarlig for resultatet, og forklare, om komponenten er mere eller mindre vigtig end de andre. Vær særlig forsigtig, når komponenten kræver en domskald fra klinikerens side (f.eks. hospitalsindlæggelser, henvisning til operation, indledning af nye antibiotika), da disse foranstaltninger er mere tilbøjelige til at vise et positivt resultat, der kan afspejle bias fra forskernes side.
endelig er det også vigtigt at kontrollere, om komponenterne i kompositmaterialet blev bestemt, før undersøgelsen blev indledt (a priori) eller efter at den var afsluttet (post hoc). Dette kan ofte hentes enten fra en omhyggelig læsning af selve undersøgelsen eller ved at kontrollere dens registerliste (hvis en findes) på clinicaltrials.gov.
Forsøgsregistre giver en oversigt over, hvilke resultater der blev specificeret, før undersøgelsen startede, så forskere ikke senere kan beslutte at kirsebærplukke andre resultater, der viste en fordel. Post hoc-ændringer af de sammensatte komponenter skal generelt ses med skepsis.
tilbage til “Tips til Forståelsesstudier”