användning av klusteranalys i randomiserade kontrollerade studier inom ortopedisk kirurgi
vår studie om användningen av klusteranalys inom ortopedisk forskning tyder på att en liten del av studierna för närvarande använder dessa viktiga statistiska metoder. Multivariabel modellering av prediktorer associerade med närvaron av justering för kluster visade en stark och signifikant samband mellan någon typ av klusterjustering och inkludering av en epidemiolog/klinisk prövningsmetodolog i studieteamet.
vår studie har flera styrkor och svagheter. Först identifierade vi systematiskt varje RCT som publicerades i de fem bästa tidskrifterna för ortopedisk kirurgi mellan 2006 och 2010. Denna metod för att begränsa till specifika tidskrifter tillåts för hela målpopulationen av artiklar som ska identifieras, i motsats till en elektronisk litteratursökning som kan missa potentiella artiklar som uppfyller inklusionskriterierna. Användning av de fem bästa tidskrifterna möjliggör också antagandet om en konservativ uppskattning i våra resultat. Men å andra sidan kan detta inte generaliseras till andra tidskrifter eller till den bredare ortopediska litteraturen. Även om en enskild individ gjorde inkludering för alla artiklar, kryssade en andra individ ett slumpmässigt urval av artiklar, vilket minimerar eventuella urvalsförskjutningar.
identifierade artiklar granskades sedan för inkludering och relevanta data extraherades av en enda forskare med erfarenhet av epidemiologi och biostatistik. Denna extraktionsmetod möjliggjorde konsistens över artiklar och upprätthöll homogena definitioner under hela processen; även om det kan finnas potential för bias på grund av extraktion av en enda granskare, träffades båda författarna under hela extraktionsprocessen för att klargöra tolkningar av extraherade data. Trots ansträngningarna att extrahera all relevant data från alla artiklar i målpopulationen underrapporterades data i flera av artiklarna. Saknade data var särskilt anmärkningsvärda för variablerna “biostatistiker” och “epidemiolog/klinisk prövningsmetodolog”; majoriteten av Författare eller studiemedlemsspecialiteter rapporterades inte i artiklarna eller kunde lätt identifieras från rubriker. I ett försök att minimera de saknade uppgifterna kontaktades motsvarande författare till varje artikel och frågades om specialiteterna hos medlemmarna i studieteamet. Men inte alla författare svarade på begäran om data. Underrapporteringen här kan förspänna våra resultat. En möjlighet är att studier som inte rapporterar studiemedlemsspecialiteter kan ha varit mindre benägna att utföra klusteranalys. Om så var fallet skulle vår studie representera artiklar av högre kvalitet och därför potentiellt vara en överskattning av användningen av klusteranalys. Denna hypotes återstår att testa.
metoden för stegvis regression som används vid analysen av dessa data är kontroversiell i vissa sammanhang, men är i allmänhet en accepterad metod för hypotesprovning och generering. Vi är inte medvetna om någon annan litteratur som undersöker prediktorer för redovisning av kluster, och undersökningens karaktär av detta mål ledde oss till detta tillvägagångssätt. Ytterligare studier behövs för att verifiera dessa resultat. Dessutom har metoden att använda GEEs för redovisning av kluster i våra analyser nyligen visats i Poisson-data för att öka sannolikheten för typ 1-fel , men inte i binära resultat. Det vill säga i ett annat papper visade Monte Carlo-simuleringar att GEE-modeller hade bättre kraft att upptäcka homogenitet inom klustret än andra metoder när man undersökte binära resultat . Vi rekommenderar att ytterligare simuleringar utförs för att bestämma giltigheten av detta tillvägagångssätt.
en slutlig potentiell svaghet i studien är cut-off-datumet för 2010. Det är möjligt att under ett och ett halvt år mellan vårt slutdatum och analysen av dessa data har nivåerna av användningen av klusteranalys i ortopediska RCT-studier förändrats. Det finns dock ingen känd identifierbar händelse som skulle initiera en sådan förändring, vilket gör detta till en marginell oro. Sammantaget är vår analys endast tillämplig på det år av papper vi granskade för dessa tidskrifter. Men vi håller fortfarande att denna analys representerar relativt nya RCT i ortopedisk kirurgi och deras användning av klusteranalyser.
även om flera artiklar tidigare har visat vikten av att ta hänsyn till kluster i RCT, har denna typ av analys ännu inte blivit standardpraxis . Vår studie tyder på en låg förekomst av justering för klustereffekter i RCT: er publicerade i ortopedisk litteratur, med endast 21,5% av inkluderade artiklar som använder någon av dessa viktiga metoder. Så vitt vi vet är vår studie den första som tittar på potentiella prediktorer för användningen av klusterjustering i RCT. Multivariabel modellering av prediktorer associerade med justering för kluster visade en stark och signifikant samband mellan någon typ av klusterjustering och inkludering av en epidemiolog/klinisk prövningsmetodolog i studieteamet. En stor effekt sågs också för inkludering av någon typ av specialist (epidemiolog/klinisk prövningsmetodolog eller biostatistiker). Detta resultat förväntades, eftersom individer som är särskilt utbildade i kliniska forskningsmetoder är mer benägna att använda korrekt metod. Genom att visa sambandet mellan en justering för kluster i en studie och närvaron av en epidemiolog eller klinisk prövningsmetodolog i studieteamet kan vi ge rekommendationer för praktiska sätt att förbättra användningen av dessa viktiga statistiska metoder. Till exempel kan införandet av en epidemiolog eller klinisk forskningsmetodolog i studiedesignfasen a priori säkerställa att lämpliga metoder planeras och implementeras som begränsar eller kontrollerar effekterna av kluster (t. ex., stratifiering, begränsning av antalet centra/leverantörer, homogena klusterstorlekar, statistiska analyser för att justera för kluster).
vi blev förvånade över att finna att införandet av en biostatistiker inte var signifikant associerad med ökad användning av klusterjusteringsmetoder. En potentiell förklaring är att epidemiologer eller kliniska prövningsmetodologer ofta ingår från designfasen av en studie, medan biostatistiker ofta bara ingår i analysfasen. Eftersom vårt resultat definieras som redovisning av klustereffekter i antingen randomisering eller statistisk analys är involvering av en specialist a priori i studien ett viktigt övervägande. Denna a priori kontra ad hoc-inkludering kan associeras med en större användning av korrekta justeringstekniker; emellertid återstår denna hypotes att testas.
förutom brist på korrekt författarspecialisering på studiegrupper finns det flera andra potentiella skäl att justering för klustereffekter för närvarande inte är en vanlig praxis. Som nämnts ovan ökar justering för kluster i allmänhet den urvalsstorlek som behövs för en viss makt, vilket gör rekryteringen till en längre eller svårare process och potentiellt ökar finansieringen och andra resursbehov. Detta kan fungera som ett hinder för forskare som initialt kan vara intresserade av att undersöka klustereffekter inom sina studier. Vi fann att många av de inkluderade studierna rapporterade att terapeuterna hade liknande utbildning eller att det inte fanns några noterade skillnader mellan terapeuter. Men detta är otillräckligt, eftersom klustereffekter fortfarande kan existera och jämlikhet mellan terapeuter inte kan antas. Vi rekommenderar att kliniska prövare utför dessa analyser där det är relevant och att institutionella granskningsnämnder och peer reviewers är noga med att påpeka behovet av dessa analyser. Dessutom kan en uppsättning standarder utvecklas som beskriver när och hur dessa justeringar kan göras, vilket ger konkreta exempel och empiriska bevis på detta behov.
effekten av kluster kan vara svår att upptäcka i studier som är underpowered när de delas med kluster; statistiska analyser som ignorerar förekomsten av potentiell kluster kommer emellertid sannolikt att resultera i alltför exakta och därför vilseledande uppskattningar . Metoderna för att utföra provstorleksberäkningar för studier med klustereffekter beror på typen av data för det primära resultatet av intresse (t.ex. kontinuerlig, binär, räkning). Flera metoder föreslås i litteraturen och flera statistiska paket har förmågan att härleda dessa uppskattningar . Som ett exempel använder många studier resultatmått som producerar kontinuerliga data, för vilka en ICC behövs för att beräkna provstorlek; detta kräver a priori kunskap om inom – och mellan – klustervariationer . Flera ansträngningar pågår för att uppmuntra användningen av klusteranalys genom att skapa databaser med ICCs för olika resultat som används i kirurgiska prövningar . Dessa databaser kommer att ge forskare information om den troliga storleken på ICCs för olika resultat och möjliggöra användning av klustereffektuppskattningar i planeringsstadierna i en försök. Detta möjliggör i sin tur noggrann beräkning av provstorlek i designfasen av en studie och därmed tillräcklig kraft för att testa hypoteser . Cook et al. föreslå att optimal användning av tillgängliga data skulle innebära en formell metaanalys av ICC-uppskattningar. Dessutom behövs mer arbete med provstorleksberäkningar och metoder för redovisning av kluster för binär och räknedata i klinisk forskning. Denna viktiga forskning bör prioriteras, med målet att informera forskare om möjliga klustereffekter efter resultat och möjliggöra bättre praxis i analyser genom a priori förståelse av potentiella klustereffekter.