Collider bias undergraver vår forståelse av COVID-19 sykdomsrisiko og alvorlighetsgrad

hvorfor observasjonell COVID-19-forskning er spesielt utsatt for collider bias

selv om det utvilsomt er verdifullt, kan observasjonsdatasett være noe av en svart boks fordi foreningene estimert innenfor dem kan skyldes mange forskjellige mekanismer. Tenk på scenariet der vi vil estimere årsakseffekten av en risikofaktor som kan generaliseres til en bredere befolkning som STORBRITANNIA (“målpopulasjonen”). Siden vi sjelden ser hele målpopulasjonen, må vi estimere denne effekten i et utvalg av individer trukket fra denne populasjonen. Hvis prøven er et sant tilfeldig utvalg fra befolkningen, så sier vi at det er representativt. Ofte blir imidlertid prøver valgt ut av bekvemmelighet eller fordi risikofaktoren eller utfallet bare måles i visse grupper (f. eks. COVID – 19 sykdomsstatus er bare observert for personer som har mottatt en test). Videre kan enkeltpersoner invitert til å delta i en prøve nekte eller senere slippe ut. Hvis egenskaper knyttet til utvalgsinkludering også er relatert til risikofaktor og utfall av interesse, introduserer dette muligheten for collider bias i vår analyse.

Collider bias forekommer ikke bare ved prøvetaking. Det kan også innføres ved statistiske modelleringsvalg. For eksempel,om det er hensiktsmessig å justere for kovariater i observasjonelle foreninger,avhenger av hvor kovariatene sitter på årsaksveien og deres rolle i datagenereringsprosessen18,19, 20, 21. Hvis vi antar at et gitt kovariat påvirker både den hypotetiske risikofaktoren og utfallet( en konfounder), er det hensiktsmessig å forutsette at kovariatet fjerner skjevhet indusert av den konfunderende strukturen. Men hvis kovariatet er en konsekvens av en eller begge eksponeringene og utfallet (en collider), i stedet for en vanlig årsak (en confounder), kan kondisjonering på kovariatet indusere, i stedet for å redusere,bias22,23, 24. Det vil si at collider bias også kan innføres når det gjøres statistiske justeringer for variabler som ligger på årsakssammenheng mellom risikofaktor og utfall. A priori kunnskap om den underliggende årsaksstrukturen til variabler og om de fungerer som en felles årsak eller felles konsekvens av risikofaktor og utfall i datagenereringsprosessen, kan være vanskelig å utlede. Derfor er det hensiktsmessig å behandle collider bias med samme grad av forsiktighet som confounding bias. Vi adresserer måter å gjøre det senere i dette papiret (“Metoder for å oppdage og minimere effektene av collider bias”).

det er flere måter data samles inn PÅ COVID-19 som kan introdusere utilsiktet kondisjonering i det valgte utvalget. Egenskapene til deltakerne rekruttert er relatert til en rekke faktorer, inkludert politiske beslutninger, kostnadsbegrensninger, teknologisk tilgang og testmetoder. Det er også allment anerkjent at den sanne forekomsten av sykdommen i befolkningen forblir ukjent25. Her beskriver vi former for datainnsamling FOR COVID – 19 før detaljering omstendighetene RUNDT COVID-19 som gjør sin analyse utsatt for collider skjevhet.

COVID-19 prøvetakingsstrategier og case/control definisjoner

Prøvetaking betinget av frivillig deltakelse (Case definisjon: sannsynlig COVID-19, Kontroll definisjon: frivillig deltaker ikke rapporterer COVID-19 symptomer, Fig. 2a): Sannsynlig COVID – 19 status kan bestemmes gjennom studier som krever frivillig deltakelse. Disse kan for eksempel omfatte undersøkelser utført av eksisterende kohort-og longitudinelle studier26,27, datakobling til administrative poster tilgjengelig i noen kohortstudier som UK Biobank28, eller mobiltelefonbaserte app-programmer29, 30. Deltakelse i vitenskapelige studier har vist seg å være sterkt ikke-tilfeldig (f. eks. deltakerne er uforholdsmessig sannsynlig å være høyt utdannede, helsebevisste og ikke-røykere), slik at frivillige i disse prøvene sannsynligvis vil avvike vesentlig fra målpopulasjonen31,32,33. Se Boks 2 Og Fig. 3 for en vignett om hvordan en study30 utforsket collider bias i denne sammenheng.

Fig. 3: Quantile-Quantile plot of-log10 p-verdier for faktorer som påvirker å bli testet FOR COVID-19 I BRITISK Biobank.
figur3

x-aksen representerer den forventede p-verdien for 2556 hypotesetester og y-aksen representerer de observerte p-verdiene. Den røde linjen representerer det forventede forholdet under nullhypotesen om ingen foreninger.

utvalgstrykk for COVID – 19-studier

Vi kan stratifisere prøvetakingsstrategiene ovenfor i tre primære prøvetakingsrammer. Den første av disse rammene er prøvetaking basert på frivillig deltakelse, som er iboende ikke-tilfeldig på grunn av faktorer som påvirker deltakelse. Den andre av disse er samplingsrammer ved HJELP AV COVID – 19 testresultater. Med få bemerkelsesverdige unntak (f. eks. refs. 3,34), er befolkningstesting FOR COVID-19 vanligvis ikke utført i tilfeldige prøver. Den tredje av disse rammene er prøvetaking basert på sykehusinnlagte pasienter, med ELLER uten COVID-19. Dette er igjen, nodvendigvis ikke-tilfeldig som det forhold pa sykehusopptak.

Boks 3 Og Fig. 3 illustrere bredden av faktorer som kan indusere utvalgstrykk. Mens noen av faktorene som påvirker prøvetakingsprosessene, kan være felles på tvers av alle prøvetakingsmåter som er oppført ovenfor, vil noen være modusspesifikke. Disse faktorene vil trolig variere i hvordan de opererer på tvers av nasjonale og helsesystemkontekster. Her viser vi en rekke mulige utvalgstrykk og hvordan de påvirker FORSKJELLIGE COVID – 19 samplingsrammer. Vi beskriver også case identifikasjon/definisjon og detalj hvordan de kan skjev slutning hvis venstre uutforsket.

alvorlighetsgrad Av Symptomer: Dette vil tenkes bias alle tre store samplingsrammer, selv om det bare forstås i sammenheng med testing. Flere land vedtok strategien om å tilby tester hovedsakelig til pasienter som opplever symptomer som er alvorlige nok til å kreve legehjelp, for eksempel sykehusinnleggelse, slik TILFELLET var i STORBRITANNIA frem til slutten av April 2020. Mange sanne positive tilfeller i populasjonen vil derfor forbli uoppdaget og vil være mindre tilbøyelige til å inngå i utvalget dersom innmelding er avhengig av teststatus. Høy forekomst av asymptomatiske virusbærere eller tilfeller med atypisk presentasjon vil ytterligere sammensatte dette problemet.

Symptomgjenkjenning: Dette vil også bias alle tre samplingsrammer som oppføring i alle prøver er betinget av symptomgjenkjenning. RELATERT til, men forskjellig fra symptom alvorlighetsgrad, VIL COVID-19 testing variere basert på symptomgjenkjennelse35. Hvis en person ikke gjenkjenner de riktige symptomene eller anser at symptomene deres ikke er alvorlige, kan de ganske enkelt bli bedt om å selvisolere og ikke motta EN COVID – 19-test. Enkeltpersoner vil vurdere deres symptom alvorlighetsgrad annerledes; de med helserelatert angst kan være mer sannsynlig å overrapportere symptomer, mens de med mindre informasjon om pandemien eller tilgang til helseråd kan være underrepresentert. Dette vil fungere funksjonelt som en differensialrate av falske negativer på tvers av individer basert på symptomgjenkjenning, noe som kan være konsekvens ved å gi de høye estimatene av asymptomatiske tilfeller og overføring36. Endring av symptomretningslinjer vil trolig sammensatte dette problemet, noe som kan indusere systematiske forhold mellom symptompresentasjon og testing35,37. Her kan grupper med lavere bevissthet (for eksempel på grunn av utilstrekkelige offentlige meldinger eller språkbarrierer) ha høyere terskler for å bli testet, og derfor vil de som tester positivt, synes å ha større risiko for alvorlige COVID-19-utfall.

Yrke: EKSPONERING FOR COVID-19 er mønstret med hensyn til yrke. I mange land er det langt mer sannsynlig at helsepersonell i frontlinjen blir testet FOR COVID – 19 enn den generelle befolkningen5, 38 på grunn av deres nærhet til viruset og de potensielle konsekvensene av infeksjonsrelatert overføring39. Som sådan vil de være tungt overrepresentert i prøver betinget av teststatus. Andre nøkkelarbeidere kan ha høy risiko for infeksjon på grunn av et stort antall kontakter i forhold til ikke-nøkkelarbeidere, og kan derfor være overrepresentert i prøver betinget av positiv teststatus eller COVID-relatert død. Eventuelle faktorer knyttet til disse yrkene (f. eks. etnisitet, sosioøkonomisk stilling, alder og grunnlinjehelse) vil derfor også være knyttet til utvalgsvalg. Figur 2b illustrerer et eksempel hvor den hypotetiske risikofaktoren (røyking) ikke trenger å påvirke utvalgsvalg (sykehusinnlagte pasienter) kausalt, det kan ganske enkelt være forbundet på grunn av sammenheng mellom risikofaktoren og utvalgsvalg (å være helsepersonell).

Etnisitet: Etniske minoriteter er også mer sannsynlig å bli smittet MED COVID-1940. Uønskede COVID – 19-utfall er betydelig verre for personer med noen etniske minoriteter41. Dette kan tenkes skjevheter estimerte foreninger innen samplingsrammer basert på sykehuspasienter, som i mange land er etniske minoritetsgrupper overrepresentert da etniske ulikheter i helse er gjennomgripende og veldokumenterte. Videre er etniske minoritetsgrupper mer sannsynlig å være nøkkelarbeidere, som er mer sannsynlig å bli utsatt FOR COVID-1942. Kulturmiljø (inkludert systemisk rasisme) og språkbarrierer kan ha negativ innvirkning på innreise til studier, både basert på testing og frivillig deltakelse43. Etniske minoritetsgrupper kan være vanskeligere å rekruttere til studier, selv innenfor et gitt område44, og kan påvirke utvalgets representativitet. Etniske minoriteter var mindre tilbøyelige til å rapportere å bli testet i vår analyse AV BRITISKE Biobankdata, hvor en av de sterkeste faktorene knyttet til å bli testet var den første genetiske hovedkomponenten, som er en markør for forfedre (Boks 3). Dermed kan dette presentere som ovenfor, med etniske minoriteters presentasjon til medisinsk behandling betinget av mer alvorlige symptomer.

Skrøpelighet: Definert her som større mottakelighet for uønskede COVID-19-utfall, er svakhet mer sannsynlig å være tilstede i visse grupper av befolkningen, for eksempel eldre voksne i langtidspleie eller sykehjem, de med eksisterende medisinske tilstander, overvektige grupper og røykere. Disse faktorene vil trolig sterkt forutsi sykehusinnleggelse. SAMTIDIG har COVID-19-infeksjon og alvorlighetsgrad sannsynligvis en innflytelse på sykehusinnleggelse8,9, 10, 45, noe som betyr at undersøkelse av disse faktorene hos innlagte pasienter kan indusere collider-skjevhet. I tillegg kan grupper behandles forskjellig når det gjelder rapportering OM COVID-19 i forskjellige land46. I STORBRITANNIA kan for EKSEMPEL tidlige rapporter om dødsfall” på GRUNN AV COVID-19 “ha blitt blandet sammen med dødsfall” mens de var infisert MED COVID-19″47. Personer med høy risiko er mer sannsynlig å bli testet generelt, men spesifikk demografi med høy risiko som de i langsiktig omsorg eller omsorgsboliger har vært mindre sannsynlig å bli samplet av mange studier46. Frailty spår også sykehusinnleggelse differensielt på tvers av ulike grupper, for eksempel, en eldre person med svært alvorlige COVID-19 symptomer i en sykehjem anlegget kan ikke tas til sykehus der en yngre person would48.

Bosted og sosial tilknytning: det er sannsynlig at det finnes flere distale eller indirekte påvirkninger på utvalgsvalg. Personer med bedre tilgang til helsetjenester kan være mer sannsynlig å bli testet enn de med dårligere tilgang. De i områder med et større antall medisinske tjenester eller bedre offentlig transport kan finne det lettere å få tilgang til tjenester for testing, mens de i områder med mindre tilgang til medisinske tjenester kan være mer sannsynlig å bli testet49. Personer som bor i områder med sterkere romlige eller sosiale bånd til eksisterende utbrudd, kan også være mer sannsynlig å bli testet på grunn av økt medisinsk årvåkenhet i disse områdene. Familie-og samfunnsstøttenettverk vil også sannsynligvis påvirke tilgangen til medisinsk behandling, for eksempel kan de med omsorgsansvar og svake støttenettverk være mindre i stand til å søke medisinsk oppmerksomhet50. Connectedness er kanskje mest sannsynlig å bias testing prøvetaking rammer, som testing er betinget av bevissthet og tilgang. Det kan imidlertid også forstyrre alle tre store samplingsrammer gjennom en lignende mekanisme for symptomgjenkjenning.

Internett-tilgang og teknologisk engasjement: Dette vil i hovedsak innebære skjevheter i frivillig rekruttering via apper, men kan også være forbundet med økt bevissthet og skjevhetstesting via symptomgjenkjennings-banen. Eksempel rekruttering via internett-applikasjoner er kjent for å underrepresentere visse grupper32, 51. Videre varierer dette etter prøvetakingsdesign, hvor frivillige eller” pull-in “datainnsamlingsmetoder har vist seg å produsere mer engasjerte, men mindre representative prøver enn reklamebaserte eller” push out ” – metoder33. Disse mer engasjerte gruppene har sannsynligvis større tilgang til elektroniske metoder for datainnsamling, og større engasjement i sosiale medier kampanjer som er utformet for å rekruttere deltakere. Som sådan er yngre mennesker mer sannsynlig å være overrepresentert i app-baserte frivillige deltakelsesstudier29.

Medisinsk og vitenskapelig interesse: Studier som rekrutterer frivillige prøver kan være partisk da De sannsynligvis vil inneholde en uforholdsmessig mengde personer som har sterk medisinsk eller vitenskapelig interesse. Det er sannsynlig at disse menneskene selv vil ha større helsebevissthet, sunnere oppførsel, være mer utdannet og ha høyere innkomster31, 52.

Mange av faktorene for å bli testet eller inkludert i datasett som er beskrevet her, er tatt med i analysen AV UK Biobank testdata (Boks 3). Hovedbudskapet er at når utvalgsrekruttering er ikke-tilfeldig, er det et utrolig bredt spekter av måter som ikke-tilfeldighet kan undergrave studieresultatene.

Metoder for å oppdage og minimere effekten av collider bias

i denne delen beskriver vi metoder for å enten adressere collider bias eller evaluere sensitiviteten av resultatene til collider bias. Som med confounding bias, er det generelt ikke mulig å bevise at noen av metodene har overvunnet collider bias. Derfor er sensitivitetsanalyser avgjørende for å undersøke robustheten av konklusjoner til plausible seleksjonsmekanismer18, 19.

en enkel, beskrivende teknikk for å vurdere sannsynligheten og omfanget av collider bias indusert av utvalgsvalg er å sammenligne midler, varianser og fordelinger av variabler i utvalget med de i målpopulasjonen (eller et representativt utvalg av målpopulasjonen)16. Dette gir informasjon om profilen til individer valgt inn i utvalget fra målgruppen av interesse, for eksempel om de har en tendens til å være eldre eller mer sannsynlig å ha komorbiditet. Det er spesielt verdifullt å rapportere disse sammenligningene for sentrale variabler i analysen, for eksempel hypotetisk risikofaktor og utfall, og andre variabler relatert til disse. Med hensyn til ANALYSEN AV COVID – 19 sykdomsrisiko er et stort hinder for dette arbeidet at i de fleste tilfeller er den faktiske forekomsten av infeksjon i den generelle befolkningen ukjent. Selv om det er oppmuntrende om utvalgsestimatene samsvarer med deres ekvivalenter på befolkningsnivå, er det viktig å innse at dette ikke definitivt viser fraværet av collider bias53. Dette skyldes at faktorer som påvirker utvalg kan være umålte i studien, eller faktorer samhandler for å påvirke utvalget og gå uoppdaget når man sammenligner marginale fordelinger.

hver metodes anvendelighet avhenger av dataene som er tilgjengelige for ikke-deltakere. Disse metodene kan grovt deles inn i to kategorier basert på tilgjengelige data: nestede og ikke-nestede prøver. En nestet prøve refererer til situasjonen når nøkkelvariabler bare måles innenfor en delmengde av en ellers representativ “superprøve”, og tvinger dermed analysen til å være begrenset til denne delprøven. Et eksempel nær denne definisjonen er underprøven av individer som har mottatt EN COVID – 19-test nestet i UK Biobank-kohorten (det er imidlertid klart AT UK Biobank-kohorten selv ikke er tilfeldig prøvet16). For nestede prøver kan forskere dra nytte av dataene som er tilgjengelige i den representative superprøven. Et ikke-nestet utvalg refererer til situasjonen når data bare er tilgjengelige i et ikke-representativt utvalg. Et eksempel på dette er prøver av innlagte personer, der ingen data er tilgjengelige på ikke-sykehusede personer. Det er vanligvis mer utfordrende å ta collider bias i ikke-nestede prøver. En veiledet analyse som illustrerer begge typer sensitivitetsanalyser ved BRUK AV Britiske Biobankdata om COVID-19-testing er presentert I Tilleggsnotat 1.

Nestede prøver: Invers sannsynlighetsvekting er en kraftig og fleksibel tilnærming for å justere for collider bias i nestede prøver54,55. Risikofaktorens årsakseffekt på utfallet estimeres ved hjelp av vektet regresjon, slik at deltakere som er overrepresentert i delprøven er nedvektet og deltakere som er underrepresentert er oppvektet. I praksis konstruerer vi disse vektene ved å estimere sannsynligheten for at ulike individer blir valgt inn i prøven fra representativ superprøve basert på deres målte kovariater56. Vi kan for eksempel bruke data fra DEN FULLSTENDIGE Britiske biobankprøven til å estimere sannsynligheten for at enkeltpersoner mottar EN TEST FOR COVID – 19 og bruke disse vektene i analyser som må begrenses til delprøven av testede individer (f.eks. identifisere risikofaktorer for å teste positivt). Seaman And White gir en detaljert oversikt over de praktiske hensyn og forutsetninger for invers sannsynlighetsvekting, for eksempel korrekt spesifikasjon av “utvalgsmodell” (en statistisk modell av forholdet mellom målte kovariater og seleksjon i utvalget, som brukes til å konstruere disse vektene), variabelt utvalg og tilnærminger for håndtering av ustabile vekter (dvs.vekter som er null eller nær null).

en ytterligere antagelse for invers sannsynlighetsvekting er at hvert individ i målpopulasjonen må ha en ikke-null sannsynlighet for å bli valgt inn i utvalget. Verken denne antakelsen, eller antagelsen om at seleksjonsmodellen er riktig spesifisert, kan testes ved hjelp av de observerte dataene alene. En konseptuelt relatert tilnærming, ved hjelp av tilbøyelighet score matching, er noen ganger brukt for å unngå indeksen hendelsen bias57,58. Det finnes også sensitivitetsanalyser for feilspesifikasjon av sannsynlighetsvekter. For eksempel, Zhao et al. utvikle en sensitivitetsanalyse for i hvilken grad estimerte sannsynlighetsvekter avviker fra de sanne uobserverte vektene59. Denne tilnærmingen er spesielt nyttig når vi kan estimere sannsynlighetsvekter, inkludert noen, men ikke nødvendigvis alle, av de relevante prediktorene for utvalgsinkludering. For eksempel kan vi estimere vekter for sannsynligheten for å motta EN COVID-19-test blant Britiske biobankdeltakere, men vi mangler viktige prediktorer som symptompresentasjon og tiltak for helsesøkende atferd.

ikke-nestede prøver: Når vi bare har data på studieprøven (f.eks. kun data om deltakere som ble testet FOR COVID-19), er det ikke mulig å estimere seleksjonsmodellen direkte siden ikke-valgte (uprøvde) individer er uobserverte. I stedet er det viktig å anvende sensitivitetsanalyser for å vurdere plausibiliteten som utvalgsvalg induserer collider bias.

Grenser og parameter søk: Det er mulig å utlede omfanget av collider bias gitt kunnskap om sannsynlig størrelse og retning av påvirkning av risikofaktor og utfall på utvalgsvalg (enten disse er direkte eller via andre faktorer)19,60,61. Denne tilnærmingen avhenger imidlertid av at størrelsen og retningen er riktig, og det er ingen andre faktorer som påvirker utvalget. Det er derfor viktig å undersøke ulike mulige utvalgsmekanismer og undersøke deres innvirkning på studiekonklusjoner. Vi opprettet en enkel webapplikasjon styrt av disse antagelsene for å tillate forskere å utforske enkle utvalgsmønstre som ville være nødvendig for å indusere en observasjonell forening: http://apps.mrcieu.ac.uk/ascrtain/. I Fig. 4 vi bruker en nylig rapport om en beskyttende sammenslutning av røyking på COVID-19-infeksjon45 for å undersøke omfanget av collider-bias som kan induseres på grunn av valgt prøvetaking, under nullhypotesen om ingen årsakseffekt.

Fig. 4: Eksempel på store assosiasjoner indusert av collider skjevhet under nullhypotesen om ingen årsakssammenheng, ved hjelp av scenarier som ligner på de som er rapportert for den observerte beskyttende assosiasjon av røyking PÅ COVID – 19 infeksjon.
figur4

Anta et enkelt scenario der den hypotetiske eksponeringen (A) og utfallet (Y) er både binære og hver påvirkningssannsynlighet for å bli valgt inn i prøven (e), f. eks. \(P (S = 1|A, Y) = \ beta _0 + \ beta _A + \beta _Y + \ beta _ {AY}\) hvor \(\beta _0\) er baseline sannsynligheten for å bli valgt, \(\beta _A\) er effekten Av A, \(\beta _Y\) er effekten Av Y og \(\beta _{AY}\) er effekten Av samspillet Mellom A og Y. valgmekanismen i spørsmålet er representert I Fig. 1b (uten interaksjonsbegrepet trukket). Denne plottet viser hvilke kombinasjoner av disse parametrene som kreves for å indusere en tilsynelatende risikoeffekt MED størrelsesklasse eller > 2 (blå region) eller en tilsynelatende beskyttende effekt med størrelsesklasse eller < 0.5 (rød region) under nullhypotesen om ingen årsakssammenheng 61. For å lage et forenklet scenario som ligner Det I Miyara et al. vi bruker en generell populasjon prevalens av røyking på 0,27 og en prøve prevalens på 0,05, og dermed fastsette \(\beta _A\) på 0,22. Fordi forekomsten AV COVID-19 ikke er kjent i den generelle befolkningen, tillater vi at utvalget er over-eller underrepresentativt (y-akse). Vi tillater også beskjedne interaksjonseffekter. Beregning over dette parameterrommet fører 40% av alle mulige kombinasjoner til en artefaktuell 2-fold beskyttende eller risikoforening som opererer gjennom denne enkle modellen av bias alene. Det er viktig å opplyse om dette usikkerhetsnivået ved publisering av observasjonsestimater.

Flere andre tilnærminger har også blitt implementert i praktiske online web apps (“Vedlegg”). For eksempel foreslo Smith Og VanderWeele en sensitivitetsanalyse som gjør det mulig for forskere å binde sine estimater ved å spesifisere følsomhetsparametere som representerer styrken av utvalgsvalg(i form av relative risikorater). De gir også en “E-verdi”, som er den minste størrelsen på disse parametrene som vil forklare bort en observert association62. Aronow og Lee foreslo en sensitivitetsanalyse for utvalgsgjennomsnitt basert på invers sannsynlighetsvekting i ikke-nestede prøver der vektene ikke kan estimeres, men antas å være avgrenset mellom to forskerspesifiserte verdier63. Dette arbeidet er generalisert til regresjonsmodeller, og lar også relevant ekstern informasjon om målpopulasjonen (f.eks. sammendragsstatistikk fra folketellingen) innlemmes64. Disse sensitivitetsanalysen gjør det mulig for forskere å undersøke om det finnes troverdige colliderstrukturer som kan forklare observasjonelle foreninger. Imidlertid representerer de ikke et uttømmende sett med modeller som kan gi opphav til bias, og de viser heller ikke nødvendigvis om collider bias påvirker resultatene. Hvis risikofaktoren for seleksjon i seg selv er et resultat av videre oppstrøms årsaker, er det viktig at virkningen av disse oppstrøms seleksjonseffektene vurderes (dvs. ikke bare hvordan risikofaktoren påvirker seleksjonen, men også hvordan årsakene til risikofaktoren og / eller årsakene til utfallet påvirker seleksjonen, F.Eks. Fig. 2b). Selv om disse oppstrøms årsakene kan individuelt ha en liten effekt på utvalg, er det mulig at mange faktorer med individuelt små effekter i fellesskap kan ha en stor utvalgseffekt og introdusere collider bias65.

Negative kontrollanalyser: hvis det er faktorer målt i det valgte utvalget som er kjent for å ikke ha noen innflytelse på utfallet, kan testing av disse faktorene for tilknytning til utfallet i det valgte utvalget tjene som en negativ kontroll66,67. I kraft bør negative kontrollforeninger være null, og de er derfor nyttige som et verktøy for å gi bevis til støtte for valg. Hvis vi observerer foreninger med større størrelser enn forventet, indikerer dette at prøven er valgt på både negativ kontroll og utfallet av interesse68,69.

Korrelasjonsanalyser: Konseptuelt lik den negative kontrolltilnærmingen ovenfor, når et utvalg er valgt, blir alle funksjonene som påvirket utvalget korrelert i prøven (bortsett fra det svært usannsynlige tilfellet som forårsaker er perfekt multiplikative). Testing for korrelasjoner blant hypotetiske risikofaktorer der det forventes at det ikke skal være noen sammenheng, kan indikere tilstedeværelse og omfang av utvalgsvalg, og dermed sannsynligheten for at collider bias forvrenger den primære analysen70.

Implikasjoner

flertallet av vitenskapelige bevis som informerer politikk og klinisk beslutningstaking under COVID – 19-pandemien, har kommet fra observasjonsstudier71. Vi har illustrert hvordan disse observasjonsstudiene er spesielt utsatt for ikke-tilfeldig prøvetaking. Randomiserte kliniske studier vil gi eksperimentelle bevis for behandling, men eksperimentelle studier av infeksjon vil ikke være mulig av etiske årsaker. Virkningen av collider bias på slutninger fra observasjonsstudier kan være betydelig, ikke bare for sykdom overføring modellering72, 73, men også for årsakssammenheng 7 og prediksjon modellering2.

mens mange tilnærminger eksisterer som forsøker å forbedre problemet med collider bias, stole de på unprovable antagelser. Det er vanskelig å vite omfanget av utvalgsvalg, og selv om det var kjent, kan det ikke bevises at det har blitt fullstendig regnskapsført av noen metode. Representative befolkningsundersøkelser34 eller prøvetakingsstrategier som unngår problemene med collider bias74, er påkrevd for å gi pålitelig bevis. Resultater fra prøver som sannsynligvis ikke er representative for målpopulasjonen, bør behandles med forsiktighet av forskere og beslutningstakere.

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert.