Collider bias ondermijnt ons begrip van covid-19 ziekterisico en-ernst

waarom observationeel covid-19-onderzoek bijzonder gevoelig is voor collider bias

hoewel observationele datasets ongetwijfeld waardevol kunnen zijn, kunnen ze een soort black box zijn omdat de geschatte associaties binnen hen te wijten kunnen zijn aan veel verschillende mechanismen. Denk aan het scenario waarin we het causale effect willen inschatten van een risicofactor die generaliseerbaar is voor een bredere populatie zoals het Verenigd Koninkrijk (de “doelpopulatie”). Aangezien we zelden de volledige doelpopulatie observeren, moeten we dit effect schatten binnen een steekproef van individuen uit deze populatie. Als de steekproef een echte willekeurige selectie uit de populatie is, dan zeggen we dat het representatief is. Vaak worden monsters echter gekozen uit gemakshalve of omdat de risicofactor of het resultaat alleen in bepaalde groepen wordt gemeten (bijv. De ziektestatus van COVID-19 wordt alleen waargenomen bij personen die een test hebben ondergaan). Bovendien kunnen personen die worden uitgenodigd om deel te nemen aan een steekproef weigeren of er vervolgens mee stoppen. Als kenmerken met betrekking tot het opnemen van monsters ook betrekking hebben op de risicofactor en het resultaat van belang, dan introduceert dit de mogelijkheid van botsingsvooroordeel in onze Analyse.

Botsingsbias komt niet alleen voor op het bemonsteringspunt. Het kan ook worden ingevoerd door statistische modelleringskeuzes. Of het bijvoorbeeld passend is om covarianten in observationele associaties aan te passen,hangt af van de plaats waar de covarianten op de causale route zitten en hun rol in het gegevens genererende proces18,19,20, 21. Als we aannemen dat een bepaalde covariant zowel de veronderstelde risicofactor als de uitkomst (een confounder) beïnvloedt, is het passend om op die covariant de voorwaarde te stellen dat de door de confoundingstructuur veroorzaakte vertekening wordt verwijderd. Echter, als de covariabele een gevolg is van een of beide of beide de blootstelling en de uitkomst (een collider), in plaats van een gemeenschappelijke oorzaak (een confounder), dan kan conditionering op de covariabele eerder bias22, 23, 24 veroorzaken dan verminderen. Dat wil zeggen, collider bias kan ook worden geà ntroduceerd bij het maken van statistische aanpassingen voor variabelen die op de causale weg tussen risicofactor en resultaat liggen. A priori kennis van de onderliggende causale structuur van variabelen en of ze functioneren als een gemeenschappelijke oorzaak of gemeenschappelijk gevolg van risicofactor en resultaat in het data genererende proces kan moeilijk worden afgeleid. Daarom is het passend om botsingsbias met een vergelijkbare mate van voorzichtigheid te behandelen als verstorende vooringenomenheid. We bespreken manieren om dit te doen later in dit artikel (“methoden voor het detecteren en minimaliseren van de effecten van collider bias”).

er zijn meerdere manieren waarop gegevens over COVID-19 worden verzameld die onbedoelde conditionering in de geselecteerde steekproef kunnen introduceren. De kenmerken van de aangeworven deelnemers houden verband met een reeks factoren, waaronder beleidsbeslissingen, kostenbeperkingen, technologische toegang en testmethoden. Ook wordt algemeen erkend dat de werkelijke prevalentie van de ziekte bij de bevolking onbekend blijft25. Hier beschrijven we de vormen van gegevensverzameling voor COVID-19 voordat we de omstandigheden rond COVID-19 beschrijven die de analyse vatbaar maken voor botsingsvooroordeel.

covid-19 steekproefstrategieën en casus/controledefinities

steekproef op voorwaarde van vrijwillige deelname (Casusdefinitie): waarschijnlijke covid-19, Controledefinitie: vrijwillige deelnemer die geen covid-19-symptomen meldt, Fig. 2a): de waarschijnlijke covid-19-status kan worden bepaald aan de hand van studies die vrijwillige deelname vereisen. Het kan bijvoorbeeld gaan om enquêtes die zijn uitgevoerd door bestaande cohort-en longitudinale studies26,27, gegevenskoppeling met administratieve gegevens die beschikbaar zijn in sommige cohortstudies zoals de Britse Biobank28, of app-programma ‘ s op basis van mobiele telefoons 29,30. De deelname aan wetenschappelijke studies blijkt sterk niet-willekeurig te zijn (bijv. deelnemers zijn onevenredig waarschijnlijk hoogopgeleid, gezondheidsbewust en niet-rokers), dus de vrijwilligers in deze monsters zullen waarschijnlijk aanzienlijk verschillen van de doelpopulatie31,32,33. Zie kader 2 en Fig. 3 voor een vignet over hoe een studie30 collider bias onderzocht in deze context.

Fig. 3: kwantiel-kwantiel plot van-log10 p-waarden voor factoren die worden getest voor COVID-19 in UK Biobank.
figuur 3

de x-as staat voor de verwachte p-waarde voor 2556 hypothesietests en de y-as staat voor de waargenomen p-waarden. De rode lijn vertegenwoordigt de verwachte relatie onder de nulhypothese van geen associaties.

voor COVID-19-onderzoeken

kunnen we bovenstaande bemonsteringsstrategieën stratificeren in drie primaire bemonsteringsframes. Het eerste van deze frames is steekproeven op basis van vrijwillige participatie, die inherent niet-willekeurig is vanwege de factoren die inspraak beïnvloeden. De tweede hiervan zijn sampling frames met behulp van covid-19 testresultaten. Met enkele opmerkelijke uitzonderingen (b. v.refs. 3,34), wordt het populatieonderzoek voor COVID-19 over het algemeen niet uitgevoerd in aselecte steekproeven. Het derde van deze frames is bemonstering op basis van gehospitaliseerde patiënten, met of zonder COVID-19. Dit is opnieuw, noodzakelijkerwijs niet-willekeurig als het Voorwaarden voor ziekenhuisopname.

kader 3 en Fig. 3 illustreren de breedte van factoren die de druk van de steekproefselectie kunnen veroorzaken. Terwijl sommige van de factoren die van invloed zijn op de bemonsteringsprocessen kunnen gemeenschappelijk zijn in alle wijzen van bemonstering hierboven vermeld, sommige zal modus specifiek zijn. Deze factoren zullen waarschijnlijk verschillen in de manier waarop zij functioneren in de nationale context en in de context van de gezondheidszorg. Hier geven we een lijst van mogelijke selectiedrukken en hoe ze van invloed zijn op verschillende covid-19 sampling frames. We beschrijven ook case identificatie / definitie en detail hoe ze kunnen bias gevolgtrekking als links onontgonnen.

ernst van de symptomen: Het is denkbaar dat dit alle drie de belangrijkste bemonsteringsframes vertekent, hoewel dit het meest eenvoudig wordt begrepen in de context van het testen. Verschillende landen hebben de strategie aangenomen om tests voornamelijk aan te bieden aan patiënten met symptomen die ernstig genoeg zijn om medische hulp nodig te hebben, zoals ziekenhuisopname, zoals het geval was in het Verenigd Koninkrijk tot eind April 2020. Veel echte positieve gevallen in de populatie zullen daarom onopgemerkt blijven en zullen minder waarschijnlijk deel uitmaken van de steekproef als de inschrijving afhankelijk is van de teststatus. De hoge tarieven van asymptomatische virusdragers of gevallen met de atypische presentatie zullen deze kwestie verder samenstellen.

Symptoomherkenning: dit zal ook de drie sampling frames vertekenen, aangezien het invoeren in alle monsters afhankelijk is van symptoomherkenning. Gerelateerd aan, maar verschillend van de ernst van de symptomen, zal covid-19 testen variëren op basis van symptoomherkenning 35. Als iemand er niet in slaagt om de juiste symptomen te herkennen of vindt dat hun symptomen niet ernstig zijn, kan hij of zij gewoon worden geïnstrueerd om zichzelf te isoleren en geen covid-19-test te ondergaan. Personen zullen hun ernst van de symptomen anders beoordelen; mensen met gezondheidsgerelateerde angst kunnen meer geneigd zijn symptomen te overmatig te melden, terwijl mensen met minder informatie over de pandemie of toegang tot gezondheidsadvies ondervertegenwoordigd kunnen zijn. Dit zal functioneel fungeren als een differentiële snelheid van vals-negatieven tussen individuen op basis van symptoomherkenning, wat zou kunnen resulteren in het geven van de hoge schattingen van asymptomatische gevallen en overdracht36. Het veranderen van symptoomrichtlijnen zal waarschijnlijk dit probleem samenstellen,dat systematische relaties tussen symptoompresentatie en testing35, 37 zou kunnen veroorzaken. Hier kunnen groepen met een lager bewustzijn (bijvoorbeeld als gevolg van ontoereikende openbare berichten of taalbarrières) hogere drempels hebben om getest te worden, en daarom zullen degenen die positief testen een groter risico lijken te lopen op ernstige covid-19-Resultaten.

beroep: blootstelling aan COVID-19 is patroon met betrekking tot beroep. In veel landen zullen gezondheidswerkers in de frontlinie veel vaker op COVID-19 worden getest dan de Algemene bevolking5, 38 vanwege hun nabijheid tot het virus en de mogelijke gevolgen van infectiegerelateerde overdracht39. Als zodanig zullen ze sterk oververtegenwoordigd zijn in monsters, afhankelijk van de teststatus. Andere belangrijke werknemers lopen mogelijk een hoog risico op infectie als gevolg van grote aantallen contacten met niet-belangrijke werknemers, en kunnen daarom oververtegenwoordigd zijn in monsters, afhankelijk van een positieve teststatus of covid-gerelateerde dood. Alle factoren die verband houden met deze beroepen (bijv. etniciteit, sociaal-economische positie, leeftijd en basisgezondheidszorg) zal daarom ook worden geassocieerd met steekproefselectie. Figuur 2b illustreert een voorbeeld waarbij de veronderstelde risicofactor (roken) de steekproefselectie (gehospitaliseerde patiënten) niet Causaal hoeft te beïnvloeden, maar gewoon kan worden geassocieerd als gevolg van het feit dat de risicofactor en de steekproefselectie (een gezondheidswerker) worden verward.Etniciteit: etnische minderheden hebben ook meer kans om besmet te raken met COVID-1940. Negatieve COVID-19-Resultaten zijn aanzienlijk slechter voor personen van sommige etnische minderheden41. Dit zou de geschatte associaties binnen steekproefkaders bij ziekenhuispatiënten kunnen beïnvloeden, aangezien in veel landen etnische minderheidsgroepen oververtegenwoordigd zijn omdat etnische ongelijkheden in de gezondheid wijdverbreid en goed gedocumenteerd zijn. Bovendien zijn etnische minderheidsgroepen waarschijnlijker sleutelfiguren, die eerder worden blootgesteld aan COVID-1942. Culturele omgeving (inclusief systemisch racisme) en taalbarrières kunnen de toegang tot studies negatief beïnvloeden, zowel op basis van tests als op basis van vrijwillige deelneming43. Etnische minderheidsgroepen kunnen, zelfs binnen een bepaald gebied44, moeilijker voor studies worden aangeworven en kunnen de representativiteit van de steekproef beïnvloeden. Etnische minderheden hadden minder kans om te rapporteren getest in onze Analyse van de Britse Biobank gegevens, waar een van de sterkste factoren geassocieerd met getest werd was de eerste genetische belangrijkste component, die een marker voor voorouders (kader 3). Dit kan zich dus voordoen als hierboven, waarbij de presentatie van etnische minderheden aan de medische zorg afhankelijk wordt gesteld van ernstigere symptomen.

broosheid: Hier gedefinieerd als een grotere gevoeligheid voor ongunstige covid-19-uitkomsten, is kwetsbaarheid eerder aanwezig in bepaalde groepen van de bevolking, zoals oudere volwassenen in langdurige zorg of begeleid wonen, mensen met reeds bestaande medische aandoeningen, zwaarlijvige groepen en rokers. Deze factoren kunnen ziekenhuisopname waarschijnlijk sterk voorspellen. Tegelijkertijd hebben covid-19-infectie en ernst waarschijnlijk een invloed op de ziekenhuisopname 8,9,10,45, wat betekent dat het onderzoeken van deze factoren bij gehospitaliseerde patiënten botsingsvooroordeel kan veroorzaken. Bovendien kunnen groepen in verschillende landen verschillend worden behandeld in termen van rapportage over COVID-1946. Bijvoorbeeld, in het Verenigd Koninkrijk vroege meldingen van sterfgevallen ” als gevolg van COVID-19 “kunnen zijn verward met sterfgevallen”terwijl besmet met COVID-19” 47. Personen met een hoog risico zullen in het algemeen eerder worden getest, maar in veel studies46 is het minder waarschijnlijk dat specifieke demografische gegevens met een hoog risico, zoals die in langdurige zorg of Voorzieningen voor begeleid wonen, worden bemonsterd. Broosheid voorspelt ook hospitalisatie in verschillende groepen, bijvoorbeeld, een oudere persoon met zeer ernstige covid-19-symptomen in een begeleid wonen faciliteit kan niet naar het ziekenhuis worden gebracht waar een jongere persoon wel zou willen 48.

woonplaats en sociale verbondenheid: er bestaan waarschijnlijk een aantal distale of indirecte invloeden op de steekproefselectie. Mensen met een betere toegang tot gezondheidszorg zullen waarschijnlijk eerder worden getest dan mensen met een slechtere toegang. Mensen in gebieden met een groter aantal medische diensten of beter openbaar vervoer kunnen gemakkelijker toegang krijgen tot diensten voor tests, terwijl mensen in gebieden met minder toegang tot medische diensten meer kans hebben om te testen49. Mensen die wonen in gebieden met sterkere ruimtelijke of sociale banden met bestaande uitbraken kunnen ook vaker worden getest als gevolg van verhoogde medische waakzaamheid in die gebieden. Netwerken voor gezinsondersteuning en ondersteuning van de Gemeenschap zullen waarschijnlijk ook de toegang tot medische zorg beïnvloeden, zo kunnen mensen met zorgtaken en zwakke ondersteunende netwerken minder in staat zijn om medische aandacht te vragen50. Connectedness is misschien het meest waarschijnlijk om het testen van monstername frames vertekening, omdat het testen is afhankelijk van bewustzijn en toegang. Nochtans, kan het ook alle drie belangrijke steekproefkaders vertekenen door een gelijkaardig mechanisme aan symptoomherkenning.

internettoegang en technologische betrokkenheid: Dit zal in de eerste plaats de vrijwillige rekrutering beïnvloeden via apps, maar kan ook geassocieerd worden met een verhoogd bewustzijn en bias testen via de symptoomherkenningsweg. Het is bekend dat bepaalde groepen ondervertegenwoordigd zijn bij de werving van steekproeven via internettoepassingen32,51. Bovendien varieert dit per steekproefopzet, waarbij is aangetoond dat vrijwillige of “pull-in” gegevensverzamelingsmethoden meer geëngageerde maar minder representatieve steekproeven opleveren dan op reclame gebaseerde of “push-out” – methoden33. Deze meer betrokken groepen hebben waarschijnlijk meer toegang tot elektronische methoden voor het verzamelen van gegevens, en een grotere betrokkenheid bij sociale media campagnes die zijn ontworpen om deelnemers te werven. Als zodanig is de kans groter dat jongeren oververtegenwoordigd zijn in op app-gebaseerde vrijwillige participatiestudies29.

medisch en wetenschappelijk belang: Studies waarbij vrijwillige steekproeven worden genomen, kunnen bevooroordeeld zijn, aangezien zij waarschijnlijk een onevenredig groot aantal mensen bevatten die een groot medisch of wetenschappelijk belang hebben. Het is waarschijnlijk dat deze mensen zelf een groter gezondheidsbewustzijn zullen hebben, gezonder gedrag zullen vertonen, meer geschoold zullen zijn en een hoger inkomen zullen hebben31, 52.

veel van de factoren om te worden getest of in de hier beschreven datasets te worden opgenomen, worden bevestigd in de analyse van de Britse Biobank-testgegevens (kader 3). De kernboodschap is dat wanneer steekproefwerving niet-willekeurig is, er een ongelooflijk breed scala van manieren is waarop die niet-willekeur studieresultaten kan ondermijnen.

methoden voor het detecteren en minimaliseren van de effecten van botsingsbias

in dit hoofdstuk beschrijven we methoden om botsingsbias aan te pakken of de gevoeligheid van de resultaten voor botsingsbias te evalueren. Net als bij verstorende bias, is het over het algemeen niet mogelijk om te bewijzen dat een van de methoden collider bias heeft overwonnen. Daarom zijn gevoeligheidsanalyses cruciaal voor het onderzoeken van de robuustheid van conclusies voor plausibele selectiemechanismen18,19.

een eenvoudige beschrijvende techniek om de waarschijnlijkheid en de omvang van de door de steekproefselectie geïnduceerde vertekening van de collider te evalueren, bestaat erin de gemiddelden, varianties en verdelingen van variabelen in de steekproef te vergelijken met die in de doelpopulatie (of een representatieve steekproef van de doelpopulatie)16. Dit verstrekt informatie over het profiel van individuen die in de steekproef van de doelpopulatie van belang worden geselecteerd, zoals of zij ouder neigen te zijn of waarschijnlijker om comorbidities te hebben. Het is met name waardevol om deze vergelijkingen te rapporteren voor belangrijke variabelen in de analyse, zoals de veronderstelde risicofactor en het resultaat, en andere hiermee verband houdende variabelen. Met betrekking tot de analyse van het risico op de ziekte van COVID-19 is een belangrijk obstakel voor dit streven dat in de meeste gevallen de feitelijke prevalentie van infecties bij de algemene bevolking onbekend is. Hoewel het bemoedigend is als de schattingen van de steekproef overeenkomen met de equivalenten op populatieniveau, is het belangrijk om te erkennen dat dit niet definitief bewijst dat er geen bias voor de botsingsval is53. Dit komt omdat factoren die de selectie beïnvloeden in de studie niet kunnen worden gemeten, of factoren interageren om de selectie te beïnvloeden en onopgemerkt blijven bij het vergelijken van marginale distributies.

de toepasbaarheid van elke methode hangt in belangrijke mate af van de gegevens die beschikbaar zijn over niet-deelnemers. Deze methoden kunnen globaal worden opgesplitst in twee categorieën op basis van de beschikbare gegevens: geneste en niet-geneste monsters. Een geneste steekproef verwijst naar de situatie waarin sleutelvariabelen alleen worden gemeten binnen een subset van een anders representatief “supermonster”, waardoor de analyse tot dit substeekproef moet worden beperkt. Een voorbeeld dat dicht bij deze definitie ligt, is de substeekproef van personen die een COVID-19-test hebben ontvangen die is genest in het Britse Biobank-cohort (hoewel het duidelijk is dat het Britse Biobank-cohort zelf niet-willekeurig wordt gebonden16). Voor geneste steekproeven kunnen de onderzoekers van de beschikbare gegevens in de representatieve super-steekproef profiteren. Een niet-geneste steekproef verwijst naar de situatie waarin gegevens alleen beschikbaar zijn in een niet-representatieve steekproef. Een voorbeeld hiervan zijn steekproeven van gehospitaliseerde individuen, waarin geen gegevens over niet-gehospitaliseerde individuen beschikbaar zijn. Het is meestal moeilijker om botsingsvooroordeel in niet-geneste monsters aan te pakken. Een geleide analyse die beide soorten gevoeligheidsanalyses illustreert aan de hand van Britse Biobankgegevens over covid-19-tests wordt gepresenteerd in aanvullende Noot 1.

geneste monsters: Inverse waarschijnlijkheidsweging is een krachtige en flexibele benadering om de botsingsbias in geneste monsters aan te passen54,55. Het causale effect van de risicofactor op de uitkomst wordt geschat aan de hand van gewogen regressie, zodat deelnemers die oververtegenwoordigd zijn in de substeekproef naar beneden worden gewogen en deelnemers die ondervertegenwoordigd zijn naar boven worden gewogen. In de praktijk construeren we deze gewichten door de kans te schatten dat verschillende individuen in de steekproef worden geselecteerd uit de representatieve supersteekproef op basis van hun gemeten covariaten56. We kunnen bijvoorbeeld gegevens uit de volledige Britse Biobank-steekproef gebruiken om de kans te schatten dat personen een test voor COVID-19 ontvangen en deze gewichten gebruiken in analyses die moeten worden beperkt tot de substeekproef van geteste personen (bijvoorbeeld het identificeren van risicofactoren voor het testen van positief). Matroos en Wit geven een gedetailleerd overzicht van de praktische overwegingen en aannames voor inverse waarschijnlijkheidsweging, zoals een correcte specificatie van het “steekproefselectiemodel” (een statistisch model van de relatie tussen gemeten covariaten en selectie in het monster, gebruikt om deze gewichten te construeren), variabele selectie en benaderingen voor het hanteren van onstabiele gewichten (d.w.z. gewichten die nul of bijna nul zijn).

een aanvullende aanname voor een inverse waarschijnlijkheidsweging is dat elk individu in de doelpopulatie een niet-NUL kans moet hebben om in de steekproef te worden geselecteerd. Noch deze aanname, noch de aanname dat het selectiemodel correct is gespecificeerd, zijn testbaar met alleen de waargenomen gegevens. Een conceptueel gerelateerde benadering, met behulp van neiging score matching, wordt soms gebruikt om te voorkomen dat index event bias57, 58. Er bestaan ook gevoeligheidsanalyses voor misspecificatie van waarschijnlijkheidsgewichten. Bijvoorbeeld, Zhao et al. ontwikkelen van een gevoeligheidsanalyse voor de mate waarin geschatte waarschijnlijkheidsgewichten verschillen van de werkelijke niet-waargenomen gewichts59. Deze benadering is vooral nuttig wanneer we waarschijnlijkheidsgewichten kunnen schatten met inbegrip van sommige, maar niet noodzakelijkerwijs alle, van de relevante voorspellers van steekproefinsluiting. We zouden bijvoorbeeld gewichten kunnen inschatten voor de kans op het ontvangen van een covid-19-test bij Britse Biobank-deelnemers, maar we missen belangrijke voorspellers zoals symptoompresentatie en metingen van het zoekgedrag in de gezondheidszorg.

niet-geneste monsters: Wanneer we alleen gegevens hebben over de studiesteekproef (bijvoorbeeld alleen gegevens over deelnemers die zijn getest op COVID-19) is het niet mogelijk om het selectiemodel rechtstreeks te schatten omdat niet-geselecteerde (niet-geteste) personen niet worden waargenomen. In plaats daarvan is het belangrijk om gevoeligheidsanalyses toe te passen om de plausibiliteit te beoordelen dat de steekproefselectie colliderbias veroorzaakt.

grenzen en parameter zoekopdrachten: Het is mogelijk om de omvang van de vooringenomenheid van de collider af te leiden gegeven kennis van de waarschijnlijke omvang en richting van de invloeden van de risicofactor en het resultaat op de steekproefselectie (of deze nu direct zijn, of via andere factoren)19,60,61. Deze benadering hangt echter af van de juiste grootte en richting en er zijn geen andere factoren die de selectie beïnvloeden. Het is daarom belangrijk om verschillende mogelijke mechanismen voor steekproefselectie te onderzoeken en de impact ervan op de conclusies van het onderzoek te onderzoeken. We creëerden een eenvoudige webapplicatie die werd geleid door deze veronderstellingen om onderzoekers in staat te stellen eenvoudige selectiepatronen te verkennen die nodig zouden zijn om een observationele associatie te veroorzaken: http://apps.mrcieu.ac.uk/ascrtain/. In Fig. 4 We gebruiken een recent rapport van een beschermende associatie van roken bij covid-19-infectie45 om de omvang van de botsingsbias te onderzoeken die kan worden veroorzaakt door geselecteerde bemonstering, onder de nulhypothese van geen causaal effect.

Fig. 4: Voorbeeld van grote associaties veroorzaakt door Collider bias onder de nulhypothese van geen causaal verband, waarbij gebruik wordt gemaakt van scenario ‘s die vergelijkbaar zijn met de gerapporteerde scenario’ s voor de waargenomen beschermende associatie van roken bij covid-19-infectie.
figuur 4

neem een eenvoudig scenario aan waarin de hypothetische blootstelling (A) en de uitkomst (Y) zowel binair zijn en elke invloedsskans om in de steekproef (S) te worden geselecteerd, bv. \(P (S = 1|A,Y) = \beta _0 + \beta _A + \beta _Y + \beta _{AY}\) waarbij \(\beta _0\) de basiswaarschijnlijkheid is om geselecteerd te worden, \(\beta _A\) het effect van A is, \(\beta _Y\) het effect van Y en \(\beta _{AY}\) het effect van de interactie tussen A en Y. Het selectiemechanisme in kwestie wordt weergegeven in Fig. 1b (zonder de interactieterm getrokken). Deze grafiek laat zien welke combinaties van deze parameters nodig zouden zijn om een schijnbaar risico-effect met magnitude of > 2 (Blauw gebied) of een schijnbaar beschermend effect met magnitude of < 0 te veroorzaken.5 (rode regio) onder de nulhypothese van geen causaal effect61. Om een vereenvoudigd scenario te creëren vergelijkbaar met dat in Miyara et al. we gebruiken een algemene populatie prevalentie van roken van 0,27 en een steekproef prevalentie van 0,05, waardoor \(\beta _A\) wordt vastgesteld op 0,22. Omdat de prevalentie van COVID-19 niet bekend is bij de algemene populatie, staan we toe dat de steekproef over – of onder-representatief is (y-as). We staan ook bescheiden interactie-effecten toe. Berekend over deze parameterruimte, leidt 40% van alle mogelijke combinaties tot een artefactuele 2-voudige beschermende of risicoverhouding die alleen door dit eenvoudige model van vooringenomenheid werkt. Het is belangrijk om dit niveau van onzekerheid bekend te maken bij het publiceren van observationele schattingen.

verschillende andere benaderingen zijn ook geïmplementeerd in handige online web apps (“bijlage”). Bijvoorbeeld, stelden Smith en vanderweele een gevoeligheidsanalyse voor die onderzoekers toestaat om hun schattingen te binden door gevoeligheidsparameters te specificeren die de sterkte van steekproefselectie vertegenwoordigen (in termen van relatieve risicoverhoudingen). Ze bieden ook een “E-waarde”, dat is de kleinste grootte van deze parameters die een waargenomen associatie weg zou verklaaren62. Aronow en Lee stelden een gevoeligheidsanalyse voor steekproefgemiddelden voor gebaseerd op omgekeerde waarschijnlijkheidsweging in niet-geneste steekproeven waar de gewichten niet kunnen worden geschat, maar worden verondersteld te worden begrensd tussen twee door onderzoekers gespecificeerde waardes63. Dit werk is veralgemeend naar regressiemodellen, waardoor ook relevante externe informatie over de doelpopulatie (bijvoorbeeld samenvattende statistieken van de telling) kon worden opgenomen 64. Deze benaderingen van gevoeligheidsanalyse stellen onderzoekers in staat om te onderzoeken of er geloofwaardige botsingsstructuren zijn die observationele associaties kunnen verklaren. Zij vormen echter geen uitputtende reeks modellen die tot vooringenomenheid zouden kunnen leiden, noch bewijzen zij noodzakelijkerwijs of de vooringenomenheid van de collider de resultaten beïnvloedt. Als de risicofactor voor selectie zelf het gevolg is van verdere upstream oorzaken, dan is het belangrijk dat rekening wordt gehouden met de impact van deze upstream selectie effecten (dat wil zeggen niet alleen hoe de risicofactor de selectie beà nvloedt, maar ook hoe de oorzaken van de risicofactor en/of de oorzaken van de uitkomst de selectie beà nvloeden, bijvoorbeeld Fig. 2b). Hoewel deze upstream oorzaken individueel een klein effect op de selectie kunnen hebben, is het mogelijk dat veel factoren met individueel kleine effecten gezamenlijk een groot selectie-effect kunnen hebben en collider bias65 introduceren.

negatieve controleanalyses: als er in het geselecteerde monster factoren zijn gemeten waarvan bekend is dat ze geen invloed hebben op het resultaat, kan het testen van deze factoren op associatie met het resultaat binnen het geselecteerde monster als negatieve controle dienen 66,67. Op grond daarvan zouden negatieve controleverenigingen nul moeten zijn en zijn zij derhalve nuttig als hulpmiddel om bewijsmateriaal te leveren ter ondersteuning van de selectie. Als we associaties met grotere magnitudes waarnemen dan verwacht dan geeft dit aan dat de steekproef wordt geselecteerd op zowel de negatieve controle als de uitkomst van rente68,69.

Correlatieanalyses: conceptueel vergelijkbaar met de negatieve controlebenadering hierboven, wanneer een steekproef wordt geselecteerd, worden alle kenmerken die de selectie hebben beïnvloed gecorreleerd binnen de steekproef (met uitzondering van het zeer onwaarschijnlijke geval dat de oorzaken perfect multiplicatief zijn). Het testen van correlaties tussen veronderstelde risicofactoren waarbij verwacht wordt dat er geen verband is, kan wijzen op de aanwezigheid en de omvang van de steekproefselectie en derhalve op de waarschijnlijkheid dat de vertekening van de botsingsverhouding de primaire analyse verstoort70.

implicaties

het merendeel van de wetenschappelijke gegevens die de beleidsvorming en de klinische besluitvorming tijdens de covid-19-pandemie ten goede komen, is afkomstig van observationele studies71. We hebben geïllustreerd hoe deze observationele studies bijzonder gevoelig zijn voor niet-willekeurige steekproeven. Gerandomiseerde klinische studies zullen experimenteel bewijs leveren voor de behandeling, maar experimentele studies van infectie zullen niet mogelijk zijn om ethische redenen. Het effect van bias op de gevolgtrekkingen uit observationele studies kan aanzienlijk zijn, niet alleen voor het modelleren van ziektetransmissie72,73, maar ook voor causale inferentie7 en voorspelling2.

hoewel er veel benaderingen bestaan die proberen het probleem van de vooringenomenheid van botsingen te verhelpen, zijn ze gebaseerd op onbewijsbare veronderstellingen. Het is moeilijk om de omvang van de steekproefselectie te kennen, en zelfs als die bekend was, kan niet worden bewezen dat er met welke methode dan ook volledig rekening mee is gehouden. Representatieve bevolkingsonderzoeken34 of bemonsteringsstrategieën die de problemen van botsingsbias74 voorkomen, zijn dringend nodig om betrouwbare gegevens te verschaffen. Resultaten van monsters die waarschijnlijk niet representatief zijn voor de doelpopulatie moeten door wetenschappers en beleidsmakers met voorzichtigheid worden behandeld.

Geef een antwoord

Het e-mailadres wordt niet gepubliceerd.