Verwendung der Clusteranalyse in randomisierten kontrollierten Studien in der orthopädischen Chirurgie
Unsere Studie zur Verwendung der Clusteranalyse in der orthopädischen Forschung legt nahe, dass ein kleiner Teil der Studien derzeit diese wichtigen statistischen Methoden verwendet. Die multivariable Modellierung von Prädiktoren, die mit dem Vorhandensein einer Anpassung für das Clustering verbunden sind, zeigte einen starken und signifikanten Zusammenhang zwischen jeder Art von Clusteranpassung und der Einbeziehung eines Epidemiologen / Methodologen für klinische Studien in das Studienteam.
Unsere Studie hat mehrere Stärken und Schwächen. Zunächst haben wir systematisch jede RCT identifiziert, die zwischen 2006 und 2010 in den fünf wichtigsten Fachzeitschriften der orthopädischen Chirurgie veröffentlicht wurde. Diese Methode der Beschränkung auf bestimmte Zeitschriften ermöglichte es, die gesamte Zielgruppe der Artikel zu identifizieren, im Gegensatz zu einer elektronischen Literaturrecherche, bei der möglicherweise potenzielle Artikel fehlen, die die Einschlusskriterien erfüllen. Die Verwendung der fünf wichtigsten Zeitschriften ermöglicht auch die Annahme einer konservativen Schätzung unserer Ergebnisse. Andererseits kann dies jedoch nicht auf andere Zeitschriften oder die breitere orthopädische Literatur verallgemeinert werden. Während eine einzelne Person die Aufnahme für alle Artikel vornahm, überprüfte eine zweite Person eine zufällige Auswahl von Artikeln, wodurch jegliche Auswahlverzerrung minimiert wurde.
Identifizierte Artikel wurden dann auf Aufnahme überprüft und relevante Daten wurden von einem einzigen Forscher mit Erfahrung in Epidemiologie und Biostatistik extrahiert. Diese Extraktionsmethode ermöglichte die Konsistenz über Artikel hinweg und behielt homogene Definitionen während des gesamten Prozesses bei; obwohl es aufgrund der Extraktion durch einen einzelnen Gutachter zu Verzerrungen kommen kann, trafen sich beide Autoren während des gesamten Extraktionsprozesses, um die Interpretation der extrahierten Daten zu klären. Trotz der Bemühungen, alle relevanten Daten aus allen Artikeln der Zielpopulation zu extrahieren, wurden die Daten in mehreren Artikeln nicht ausreichend gemeldet. Fehlende Daten waren besonders bemerkenswert für die Variablen “Biostatistiker” und “Epidemiologe / klinische Studien Methodologe”; die Mehrheit der Autor oder Studienmitglied Spezialitäten wurden nicht in den Artikeln oder leicht identifizierbar aus Überschriften berichtet. Um die fehlenden Daten zu minimieren, wurde der entsprechende Autor jedes Artikels kontaktiert und nach den Spezialitäten der Mitglieder des Studienteams gefragt. Allerdings reagierten nicht alle Autoren auf die Anfrage nach Daten. Die Unterberichterstattung hier kann unsere Ergebnisse verzerren. Eine Möglichkeit besteht darin, dass Studien, die keine Studienmitgliedsspezialitäten melden, weniger wahrscheinlich eine Clusteranalyse durchgeführt haben. Wenn dies der Fall wäre, würde unsere Studie die hochwertigeren Artikel darstellen und daher möglicherweise eine Überschätzung der Verwendung von Clustering-Analysen darstellen. Diese Hypothese muss noch getestet werden.
Die Methode der schrittweisen Regression, die bei der Analyse dieser Daten verwendet wird, ist in einigen Kontexten umstritten, bleibt jedoch im Allgemeinen eine akzeptierte Methode zum Testen und Generieren von Hypothesen. Uns ist keine andere Literatur bekannt, die Prädiktoren für die Bilanzierung von Clustern untersucht, und der Untersuchungscharakter dieses Ziels hat uns zu diesem Ansatz geführt. Weitere Studien sind erforderlich, um diese Ergebnisse zu überprüfen. Darüber hinaus wurde kürzlich gezeigt, dass die Methode der Verwendung von GEEs zur Berücksichtigung von Clustern in unseren Analysen in Poisson-Daten die Wahrscheinlichkeit von Typ-1-Fehlern erhöht , nicht jedoch in binären Ergebnissen. Das heißt, in einem anderen Papier zeigten Monte-Carlo-Simulationen, dass GEE-Modelle eine bessere Leistung bei der Erkennung von Homogenität innerhalb des Clusters hatten als andere Methoden bei der Untersuchung binärer Ergebnisse . Wir empfehlen, zusätzliche Simulationen durchzuführen, um die Gültigkeit dieses Ansatzes zu bestimmen.
Eine letzte potenzielle Schwäche der Studie ist der Stichtag 2010. Es ist möglich, dass sich in den anderthalb Jahren zwischen unserem Stichtag und der Analyse dieser Daten das Ausmaß der Verwendung der Clusteranalyse in orthopädischen RCT-Studien geändert hat. Es ist jedoch kein identifizierbares Ereignis bekannt, das eine solche Änderung auslösen würde, was dies zu einem marginalen Problem macht. Insgesamt gilt unsere Analyse nur für das Jahr der Arbeiten, die wir für diese Zeitschriften überprüft haben. Wir sind jedoch der Ansicht, dass diese Analyse relativ neue RCTs in der orthopädischen Chirurgie und deren Verwendung von Clustering-Analysen darstellt.
Obwohl mehrere Arbeiten zuvor gezeigt haben, wie wichtig es ist, Clustering in RCTs zu berücksichtigen, ist diese Art der Analyse noch nicht zur Standardpraxis geworden . Unsere Studie deutet auf eine geringe Prävalenz der Anpassung für Clustering-Effekte in RCTs hin, die in der orthopädischen Literatur veröffentlicht wurden, wobei nur 21,5% der eingeschlossenen Artikel eine dieser wichtigen Methoden verwendeten. Nach unserem besten Wissen ist unsere Studie die erste, die potenzielle Prädiktoren für die Verwendung von Clustering-Anpassung in RCTs untersucht. Die multivariable Modellierung von Prädiktoren im Zusammenhang mit der Anpassung an das Clustering zeigte einen starken und signifikanten Zusammenhang zwischen jeder Art von Clusteranpassung und der Einbeziehung eines Epidemiologen / Methodologen für klinische Studien in das Studienteam. Ein großer Effekt wurde auch für die Einbeziehung jeglicher Art von Spezialisten (Epidemiologe / Methodologe für klinische Studien oder Biostatistiker) beobachtet. Dieser Befund wurde erwartet, da Personen, die speziell in klinischen Forschungsmethoden geschult sind, eher die richtige Methodik anwenden. Durch den Nachweis des Zusammenhangs zwischen einer Anpassung für das Clustering in einer Studie und der Anwesenheit eines Epidemiologen oder Methodologen für klinische Studien im Studienteam können wir Empfehlungen für praktische Wege zur Verbesserung der Verwendung dieser wichtigen statistischen Methoden geben. Zum Beispiel könnte die Einbeziehung eines Epidemiologen oder klinischen Forschungsmethodikers in die Studiendesignphase a priori sicherstellen, dass geeignete Methoden geplant und implementiert werden, die die Auswirkungen von Clustering begrenzen oder kontrollieren (z. b. Stratifizierung, Begrenzung der Anzahl der Zentren/Anbieter, homogene Clustergrößen, statistische Auswertungen zur Anpassung an Clustering).
Wir waren überrascht, dass die Einbeziehung eines Biostatistikers nicht signifikant mit einem verstärkten Einsatz von Clustering-Anpassungsmethoden verbunden war. Eine mögliche Erklärung ist, dass Epidemiologen oder Methodologen klinischer Studien häufig bereits in der Designphase einer Studie einbezogen werden, während Biostatistiker häufig erst in der Analysephase einbezogen werden. Da unser Ergebnis so definiert ist, dass Clustereffekte entweder in der Randomisierung oder in der statistischen Analyse berücksichtigt werden, ist die Einbeziehung eines Spezialisten a priori in die Studie eine wichtige Überlegung. Diese A-priori-versus-ad-hoc-Einbeziehung kann mit einem stärkeren Einsatz geeigneter Anpassungstechniken verbunden sein; Diese Hypothese muss jedoch noch getestet werden.
Neben der fehlenden Spezialisierung der Autoren auf Studienteams gibt es mehrere andere mögliche Gründe dafür, dass die Anpassung an Clustering-Effekte derzeit keine gängige Praxis ist. Wie oben erwähnt, erhöht die Anpassung an das Clustering im Allgemeinen die für eine bestimmte Leistung erforderliche Stichprobengröße, was die Rekrutierung zu einem längeren oder schwierigeren Prozess macht und möglicherweise den Finanzierungs- und anderen Ressourcenbedarf erhöht. Dies könnte ein Hindernis für Forscher darstellen, die zunächst daran interessiert sein könnten, Clustereffekte in ihren Studien zu untersuchen. Wir fanden heraus, dass viele der eingeschlossenen Studien berichteten, dass die Therapeuten eine ähnliche Ausbildung hatten oder dass es keine Unterschiede zwischen den Therapeuten gab. Dies ist jedoch unzureichend, da möglicherweise noch Clustereffekte bestehen und keine Gleichheit der Therapeuten angenommen werden kann. Wir empfehlen, dass klinische Trialisten diese Analysen gegebenenfalls durchführen und dass institutionelle Prüfungsausschüsse und Peer-Reviewer darauf achten, auf die Notwendigkeit dieser Analysen hinzuweisen. Darüber hinaus könnte eine Reihe von Standards entwickelt werden, die beschreiben, wann und wie diese Anpassungen vorgenommen werden können, und konkrete Beispiele und empirische Belege für diesen Bedarf liefern.
Der Effekt des Clusters kann in Studien, die bei Aufteilung nach Clustern unterversorgt sind, schwer zu erkennen sein; statistische Analysen, die das Vorhandensein potenzieller Clusterbildung ignorieren, führen jedoch höchstwahrscheinlich zu übermäßig genauen und daher irreführenden Schätzungen . Die Methoden zur Durchführung von Stichprobengrößenberechnungen für Studien mit Clustereffekten hängen von der Art der Daten für das primäre interessierende Ergebnis ab (z. B. kontinuierlich, binär, grafisch). In der Literatur werden verschiedene Methoden vorgeschlagen, und mehrere statistische Pakete können diese Schätzungen ableiten . Als Beispiel verwenden viele Studien Ergebnismaße, die kontinuierliche Daten erzeugen, für die ein ICC benötigt wird, um die Stichprobengröße zu berechnen; Dies erfordert eine a priori Kenntnis der Varianzen innerhalb und zwischen den Clustern . Mehrere Bemühungen sind im Gange, um die Verwendung von Clustering-Analyse durch die Schaffung von Datenbanken von ICCs für verschiedene Ergebnisse in chirurgischen Studien zu fördern . Diese Datenbanken geben den Forschern Informationen über die wahrscheinliche Größe von ICCs für verschiedene Ergebnisse und ermöglichen die Verwendung von Schätzungen des Clustereffekts in der Planungsphase einer Studie. Dies wiederum ermöglicht eine genaue Berechnung der Stichprobengröße in der Entwurfsphase einer Studie und damit eine ausreichende Leistung zum Testen von Hypothesen . Koch et al. schlagen Sie vor, dass die optimale Nutzung der verfügbaren Daten eine formale Metaanalyse der ICC-Schätzungen beinhalten würde. Darüber hinaus ist mehr Arbeit an Stichprobengrößenberechnungen und Methoden zur Bilanzierung von Clustering für Binär- und Zähldaten in der klinischen Forschung erforderlich. Diese wichtige Forschung sollte priorisiert werden, mit dem Ziel, die Forscher über mögliche Clustereffekte nach Ergebnissen zu informieren und bessere Analysepraktiken durch ein A-priori-Verständnis potenzieller Clustereffekte zu ermöglichen.