anvendelse af klyngeanalyse i randomiserede kontrollerede forsøg i ortopædkirurgi
vores undersøgelse af brugen af klyngeanalyse i ortopædisk forskning antyder, at en lille del af undersøgelserne i øjeblikket anvender disse vigtige statistiske metoder. Multivariabel modellering af forudsigere forbundet med tilstedeværelsen af justering for klyngedannelse viste en stærk og signifikant sammenhæng mellem enhver form for klyngejustering og inkludering af en epidemiolog/klinisk forsøg metodolog på studieteamet.
vores undersøgelse har flere styrker og svagheder. For det første identificerede vi systematisk hver RCT, der blev offentliggjort i de fem bedste tidsskrifter for ortopædkirurgi mellem 2006 og 2010. Denne metode til begrænsning til specifikke tidsskrifter gjorde det muligt at identificere hele målpopulationen af artikler i modsætning til en elektronisk litteratursøgning, der muligvis går glip af potentielle artikler, der opfylder inklusionskriterierne. Brug af de fem bedste tidsskrifter tillader også antagelsen om et konservativt skøn i vores fund. Men på den anden side kan dette ikke generaliseres til andre tidsskrifter eller til den bredere ortopædiske litteratur. Mens en enkelt person inkluderede alle artikler, krydstjekkede et andet individ et tilfældigt udvalg af artikler, hvilket minimerer enhver valgforstyrrelse.
identificerede artikler blev derefter gennemgået for inkludering, og relevante data blev ekstraheret af en enkelt forsker med erfaring inden for epidemiologi og biostatistik. Denne ekstraktionsmetode muliggjorde konsistens på tværs af artikler og opretholdt homogene definitioner gennem hele processen; imidlertid, mens der kan være potentiale for bias på grund af ekstraktion fra en enkelt korrekturlæser, begge forfattere mødtes gennem hele udvindingsprocessen for at afklare fortolkninger af ekstraherede data. På trods af bestræbelserne på at udtrække alle relevante data fra alle artikler i målpopulationen blev data underrapporteret i flere af artiklerne. Manglende data var især bemærkelsesværdige for variablerne” biostatistiker “og” epidemiolog/kliniske forsøg metodolog”; størstedelen af forfatter-eller studiemedlemsspecialiteter blev ikke rapporteret i artiklerne eller let identificerbare fra overskrifter. I et forsøg på at minimere de manglende data blev den tilsvarende forfatter af hver artikel kontaktet og spurgt om specialiteterne hos medlemmer af studieteamet. Imidlertid reagerede ikke alle forfattere på anmodningen om data. Underrapporteringen her kan forringe vores resultater. En mulighed er, at undersøgelser, der ikke rapporterer studiemedlemsspecialiteter, måske har været mindre tilbøjelige til at udføre klyngeanalyse. Hvis dette var tilfældet, ville vores undersøgelse repræsentere artikler af højere kvalitet og derfor potentielt være et overestimat af brugen af klyngeanalyse. Denne hypotese skal stadig testes.
metoden til trinvis regression anvendt i analysen af disse data er kontroversiel i nogle sammenhænge, men forbliver generelt en accepteret metode til hypotesetestning og generering. Vi er ikke opmærksomme på nogen anden litteratur, der undersøger forudsigere for regnskab for klyngedannelse, og undersøgelsens karakter af dette mål førte os til denne tilgang. Yderligere undersøgelser er nødvendige for at verificere disse fund. Desuden er metoden til at bruge GEEs til Regnskab for klyngedannelse i vores analyser for nylig blevet vist i Poisson-data for at øge sandsynligheden for type 1-fejl , men ikke i binære resultater. Det vil sige, i et andet papir viste Monte Carlo-simuleringer, at GEE-modeller havde bedre magt til at detektere homogenitet inden for klyngen end andre metoder, når de undersøgte binære resultater . Vi anbefaler, at der udføres yderligere simuleringer for at bestemme gyldigheden af denne tilgang.
en endelig potentiel svaghed i undersøgelsen er Skæringsdatoen for 2010. Det er muligt, at i halvandet år mellem vores skæringsdato og analysen af disse data, niveauer af brugen af klyngeanalyse i ortopædiske RCT-undersøgelser er ændret. Der er dog ingen kendt identificerbar begivenhed, der vil indlede en sådan ændring, hvilket gør dette til en marginal bekymring. Samlet set, vores Analyse gælder kun for det år, hvor papirer, vi gennemgik for disse tidsskrifter. Men, vi mener stadig, at denne analyse repræsenterer relativt nylige RCT ‘ er inden for ortopædkirurgi og deres anvendelse af klyngeanalyser.
selvom flere papirer tidligere har vist vigtigheden af at tage gruppering i betragtning i RCT ‘ er, er denne type analyse endnu ikke blevet standardpraksis . Vores undersøgelse antyder en lav prævalens af justering for klyngeeffekter i RCT ‘ er offentliggjort i den ortopædiske litteratur, hvor kun 21,5% af de inkluderede artikler bruger en af disse vigtige metoder. Så vidt vi ved, er vores undersøgelse den første til at se på potentielle forudsigere for brugen af klyngejustering i RCT ‘ er. Multivariabel modellering af forudsigere forbundet med justering for klyngedannelse viste en stærk og signifikant sammenhæng mellem enhver form for klyngejustering og inkludering af en epidemiolog/kliniske forsøg metodolog på studieteamet. En stor effekt blev også set for inkludering af enhver type specialist (epidemiolog/kliniske forsøg metodolog eller biostatistiker). Dette fund var forventet, idet personer, der specifikt er uddannet i kliniske forskningsmetoder, er mere tilbøjelige til at anvende korrekt metode. Ved at demonstrere sammenhængen mellem en justering for klyngedannelse i en undersøgelse og tilstedeværelsen af en epidemiolog eller metodolog i kliniske forsøg på studieteamet, vi er i stand til at komme med anbefalinger til praktiske måder at forbedre brugen af disse vigtige statistiske metoder. For eksempel kan inkluderingen af en epidemiolog eller klinisk forskningsmetodolog i undersøgelsesdesignfasen a priori sikre, at ordentlige metoder planlægges og implementeres, der begrænser eller kontrollerer virkningerne af klyngedannelse (f. eks., stratificering, begrænsning af antallet af Centre / udbydere, homogene klyngestørrelser, statistiske analyser til justering for klyngedannelse).
vi var overraskede over at finde ud af, at inkluderingen af en biostatistiker ikke var signifikant forbundet med øget brug af klyngejusteringsmetoder. En potentiel forklaring er, at epidemiologer eller kliniske forsøgsmetodologer ofte er inkluderet fra designfasen af en undersøgelse, mens biostatistikere ofte kun er inkluderet i analysefasen. Da vores resultat er defineret som regnskab for klyngeeffekter i enten randomisering eller statistisk analyse, involvering af en specialist a priori i undersøgelsen er en vigtig overvejelse. Denne a priori versus ad hoc-inklusion kan være forbundet med en større anvendelse af korrekt justeringsteknikker; denne hypotese skal dog stadig testes.
ud over en mangel på ordentlig forfatterspecialisering på studieteams er der flere andre potentielle grunde til, at justering for klyngeeffekter ikke i øjeblikket er en almindelig praksis. Som nævnt ovenfor øger justering for klyngedannelse generelt den stikprøvestørrelse, der er nødvendig for en given magt, hvilket gør rekruttering til en længere eller vanskeligere proces og potentielt øger finansiering og andre ressourcebehov. Dette kan fungere som en barriere for forskere, der oprindeligt kunne være interesserede i at undersøge klyngeeffekter inden for deres studier. Vi fandt ud af, at mange af de inkluderede undersøgelser rapporterede, at terapeuterne havde lignende træning, eller at der ikke var nogen bemærkede forskelle mellem terapeuter. Men dette er utilstrækkeligt, da klyngeeffekter stadig kan eksistere, og lighed mellem terapeuter ikke kan antages. Vi anbefaler, at kliniske trialister udfører disse analyser, hvor det er relevant, og at institutionelle gennemgangsudvalg og peer-korrekturlæsere er omhyggelige med at påpege behovet for disse analyser. Derudover kunne der udvikles et sæt standarder, der skitserer, hvornår og hvordan disse justeringer kan udføres, hvilket giver konkrete eksempler og empiriske beviser for dette behov.
effekten af klyngedannelse kan være vanskelig at opdage i undersøgelser, der er understyrkede, når de divideres med klynge; imidlertid, statistiske analyser, der ignorerer tilstedeværelsen af potentiel klyngedannelse, vil sandsynligvis resultere i alt for præcise og derfor vildledende skøn . Metoderne til udførelse af stikprøvestørrelsesberegninger for undersøgelser med klyngeeffekter afhænger af typen af data for det primære resultat af interesse (f.eks. Flere metoder foreslås i litteraturen, og flere statistiske pakker har evnen til at udlede disse estimater . Som et eksempel bruger mange undersøgelser resultatmål, der producerer kontinuerlige data, for hvilke en ICC er nødvendig for at beregne stikprøvestørrelse; dette kræver en forudgående viden om afvigelser inden for og mellem klynger . Flere bestræbelser er i gang for at tilskynde til brugen af klyngeanalyse gennem oprettelse af databaser over ICC ‘ er til forskellige resultater, der anvendes i kirurgiske forsøg . Disse databaser vil give forskere information om den sandsynlige størrelse af ICC ‘ er for forskellige resultater og muliggøre brugen af klyngeeffektestimater i planlægningsfasen af et forsøg. Dette vil igen muliggøre nøjagtig beregning af stikprøvestørrelse i designfasen af en undersøgelse og dermed tilstrækkelig magt til at teste hypoteser . Cook et al. foreslå, at den optimale anvendelse af tilgængelige data ville indebære en formel metaanalyse af ICC-estimater. Desuden er der behov for mere arbejde på stikprøvestørrelsesberegninger og metoder til Regnskab for klyngedannelse for binære og tælledata i klinisk forskning. Denne vigtige forskning bør prioriteres med det formål at informere forskere om mulige klyngeeffekter efter resultat og muliggøre bedre praksis i analyser gennem en priori forståelse af potentielle klyngeeffekter.