Törmäysharhat heikentävät ymmärrystämme COVID-19-taudin riskistä ja vakavuudesta

miksi COVID-19-taudin havainnoiva tutkimus on erityisen altis törmäysharhalle

vaikka kiistatta arvokkaat havaintoaineistot voivat olla jotain mustaa laatikkoa, koska niiden sisällä arvioidut assosiaatiot voivat johtua monista eri mekanismeista. Tarkastellaan skenaariota, jossa haluamme arvioida riskitekijän kausaalista vaikutusta, joka on yleistettävissä laajempaan väestöön, kuten Yhdistyneeseen kuningaskuntaan (“kohdeväestö”). Koska havaitsemme harvoin koko kohdepopulaatiota, meidän on arvioitava tämä vaikutus tästä populaatiosta otettujen yksilöiden otoksessa. Jos otos on todellinen Satunnaisvalinta perusjoukosta, niin sanomme, että se on edustava. Usein näytteet valitaan kuitenkin mukavuussyistä tai siksi, että riskitekijä tai tulos mitataan vain tietyissä ryhmissä (esim. COVID-19-tautitilanne havaitaan vain testin saaneilla henkilöillä). Lisäksi henkilöt, jotka on pyydetty osallistumaan otokseen, voivat kieltäytyä tai myöhemmin jättäytyä pois. Jos näytteiden sisällyttämiseen liittyvät ominaisuudet liittyvät myös riskitekijään ja kiinnostuksen lopputulokseen, tämä tuo esiin mahdollisuuden törmäysharhaan analyysissamme.

Törmäysharhaa ei esiinny ainoastaan näytteenottopaikalla. Se voidaan ottaa käyttöön myös tilastollisilla mallintamisvalinnoilla. Esimerkiksi se, onko tarkoituksenmukaista säätää kovariaatteja havaintoyhtälöissä, riippuu siitä, missä kovariaatit istuvat kausaalisella reitillä ja niiden roolista tiedon tuottamisprosessissa18, 19, 20, 21. Jos oletamme, että tietty kovariaatti vaikuttaa sekä oletettuun riskitekijään että lopputulokseen (confounder), on aiheellista edellyttää, että kovariaatti poistaa sekoittavan rakenteen aiheuttama bias. Kuitenkin, jos kovariaatti on seurausta jommastakummasta tai sekä altistuksesta että lopputuloksesta (törmäyttäjä), eikä yleinen syy (sekoittaja), niin kovariaatin ehdollistuminen voi vähentää sen sijaan bias22, 23, 24: ää. Toisin sanoen törmäysharha voidaan ottaa käyttöön myös, kun tehdään tilastollisia korjauksia muuttujille, jotka ovat syy-seuraus-reitillä riskitekijän ja tuloksen välillä. Ennalta tietoa muuttujien taustalla olevasta syy-seurausrakenteesta ja siitä, toimivatko ne riskitekijän ja lopputuloksen yhteisenä syynä tai yhteisenä seurauksena tiedonkeruuprosessissa, voi olla vaikea päätellä. Siksi on aiheellista käsitellä törmäyttimen bias samalla varovaisuudella kuin sekoittava bias. Käsittelemme tapoja tehdä niin myöhemmin tässä asiakirjassa (“menetelmät havaitsemiseksi ja minimoimiseksi vaikutuksia törmäyttimen bias”).

COVID-19: stä kerätään tietoa useilla tavoilla, jotka voivat aiheuttaa tahatonta ehdollistumista valitussa näytteessä. Rekrytoitavien osallistujien ominaispiirteet liittyvät useisiin tekijöihin, kuten poliittisiin päätöksiin, kustannusrajoituksiin, teknologiseen saatavuuteen ja testausmenetelmiin. On myös yleisesti tunnustettu, että taudin todellinen esiintyvyys väestössä on edelleen tuntematta25. Tässä kuvataan COVID-19: n tiedonkeruun muotoja ennen kuin yksityiskohtaisesti COVID-19: ää ympäröivät olosuhteet, jotka tekevät sen analyysin alttiiksi törmäysharhalle.

COVID-19-NÄYTTEENOTTOSTRATEGIAT ja case/control-määritelmät

näytteenotto ehdollinen vapaaehtoiselle osallistumiselle (Tapausmääritelmä: todennäköinen COVID-19, kontrollin määritelmä: vapaaehtoinen osallistuja, joka ei ilmoita COVID-19-oireita, Kuva. 2a): todennäköinen COVID-19-tila voidaan määrittää vapaaehtoista osallistumista edellyttävillä tutkimuksilla. Näitä voivat olla esimerkiksi olemassa olevien kohortti-ja pitkittäistutkimusten26,27, tietojen yhdistäminen hallinnollisiin tietueisiin, joita on saatavilla joissakin kohorttitutkimuksissa,kuten Yhdistyneen kuningaskunnan Biopankissa28, tai matkapuhelinpohjaiset sovellusohjelmat29, 30. Tieteellisiin tutkimuksiin osallistuminen on osoitettu vahvasti ei-satunnaiseksi (esim. osallistujat ovat suhteettoman todennäköisesti korkeasti koulutettuja, terveystietoisia ja tupakoimattomia), joten näiden näytteiden vapaaehtoiset poikkeavat todennäköisesti huomattavasti kohdeväestöstä31,32,33. KS. laatikko 2 ja kuva. 3 varten vinjetti siitä, miten yksi study30 tutkittu törmäyttimen bias tässä yhteydessä.

Kuva. 3: Kvantiili-Kvantiili tontti-log10 p-arvot tekijöistä, jotka vaikuttavat testattavan COVID-19 UK biopankissa.
kuva3

x-akseli edustaa odotettua P-arvoa 2556 hypoteesitestissä ja y-akseli havainnoitua p-arvoa. Punainen viiva kuvaa oletettua suhdetta nollahypoteesin mukaan, jossa ei ole assosiaatioita.

COVID-19-tutkimusten Näytteenvalintapaineet

voimme osittaa edellä mainitut näytteenottostrategiat kolmeen perusnäytteenottokehikkoon. Ensimmäinen näistä kehyksistä on vapaaehtoiseen osallistumiseen perustuva otanta, joka on luonnostaan ei-satunnaista osallistumiseen vaikuttavien tekijöiden vuoksi. Toinen näistä on COVID-19-testituloksia hyödyntävät OTANTAKEHIKOT. Muutamaa merkittävää poikkeusta lukuun ottamatta (esim. 3,34), COVID-19-taudin populaatiotestausta ei yleensä tehdä satunnaisnäytteistä. Kolmas näistä kehyksistä on otanta, joka perustuu SAIRAALAPOTILAISIIN, joilla on COVID-19 tai ei ole. Tämä on jälleen, välttämättä ei-satunnainen, koska se ehtoja sairaalan ottamista.

laatikko 3 ja kuva. 3 kuvaa leveys tekijöitä, jotka voivat aiheuttaa näytteen valintapaine. Vaikka jotkin näytteenottoprosesseihin vaikuttavista tekijöistä voivat olla yhteisiä kaikissa edellä luetelluissa näytteenottotavoissa, jotkin niistä ovat moodikohtaisia. Nämä tekijät todennäköisesti eroavat toisistaan siinä, miten ne toimivat eri kansallisissa ja terveydenhuoltojärjestelmissä. Tässä listataan sarja mahdollisia VALINTAPAINEITA ja miten ne vaikuttavat erilaisiin COVID-19-näytteenottokehyksiin. Kuvaamme myös tapauksen tunnistus / määritelmä ja yksityiskohtaisesti, miten ne voivat bias päättely, jos jätetään tutkimatta.

oireiden vaikeusaste: Tämä todennäköisesti harhauttaa kaikkia kolmea suurta näytteenottokehystä, vaikka se ymmärretään yksinkertaisimmin testauksen yhteydessä. Useat maat hyväksyivät strategian, jonka mukaan testejä tarjotaan pääasiassa potilaille, joilla on niin vakavia oireita, että ne vaativat lääkärinhoitoa, esimerkiksi sairaalahoitoa, kuten Yhdistyneessä kuningaskunnassa tehtiin huhtikuun 2020 loppuun asti. Monet todelliset positiiviset tapaukset populaatiossa jäävät siten havaitsematta ja ovat epätodennäköisempiä, jos ilmoittautuminen riippuu testitilanteesta. Korkea määrä oireeton viruskantajien tai tapauksissa epätyypillinen esitys edelleen pahentaa tätä kysymystä.

oireiden tunnistaminen: tämä myös vääristää kaikkia kolmea näytteenottokehystä, koska kaikkiin näytteisiin pääsy edellyttää oireiden tunnistamista. COVID-19-testaaminen liittyy oireiden vakavuuteen, mutta eroaa siitä oireiden tunnistamisesta35. Jos henkilö ei tunnista oikeita oireita tai pitää oireitaan epäsiisteinä, häntä voidaan yksinkertaisesti kehottaa eristäytymään itsestään ja olemaan saamatta COVID-19-testiä. Henkilöt arvioivat oireensa vakavuuden eri tavalla; ne, joilla on terveyteen liittyvä ahdistus voi olla todennäköisempää yli-raportoida oireita, kun taas ne, joilla on vähemmän tietoa pandemiasta tai pääsy terveysneuvontaan, voivat olla aliedustettuja. Tämä toimii toiminnallisesti erotuksena väärien negatiivisten yksilöiden välillä oireiden tunnistamisen perusteella, mikä voi olla seurausta antaa korkeat arviot oireettomista tapauksista ja transmissiosta36. Oireohjeiden muuttaminen todennäköisesti pahentaa tätä ongelmaa,mikä voi aiheuttaa järjestelmällisiä suhteita oireiden esittämisen ja testaamisen välillä 35, 37. Ryhmillä, joilla on vähemmän tietoisuutta (esimerkiksi puutteellisen julkisen viestinnän tai kielimuurien vuoksi), voi olla korkeampi kynnys päästä testiin, ja siksi positiivisen testituloksen saaneilla näyttää olevan suurempi riski saada vakavia COVID-19-tuloksia.

miehitys: COVID-19-taudille altistuminen on kuvioitu miehityksen suhteen. Monissa maissa etulinjan terveydenhuollon työntekijät joutuvat paljon todennäköisemmin COVID-19-testattavaksi kuin yleinen väestö5,38, koska he ovat lähellä virusta ja koska tartuntaan liittyvät transmissiot ovat mahdollisia seurauksia39. Näin ollen ne ovat huomattavasti yliedustettuina testitilanteen ehdollisissa näytteissä. Muilla avaintyöntekijöillä voi olla suuri tartuntariski suuren kontaktimäärän vuoksi verrattuna muihin kuin avainhenkilöihin, ja siksi he voivat olla yliedustettuina näytteissä, joiden edellytyksenä on positiivinen TESTITILANNE tai COVID-tautiin liittyvä kuolema. Kaikki näihin ammatteihin liittyvät tekijät (esim. etnisyys, sosioekonominen asema, ikä ja perusterveys) liittyvät siis myös otoksen valintaan. Kuviossa 2b esitetään esimerkki, jossa oletetun riskitekijän (tupakointi) ei tarvitse vaikuttaa otoksen valintaan (sairaalahoidossa olevat potilaat) syyperusteisesti, vaan se voi yksinkertaisesti liittyä riskitekijän ja otoksen valinnan sekoittumiseen (terveydenhuoltoalan työntekijä).

etnisyys: etniset vähemmistöt saavat myös todennäköisemmin COVID-1940-tartunnan. COVID-19-taudin haittavaikutukset ovat huomattavasti huonommat joidenkin etnisten vähemmistöjen yksilöillä41. Tämä voisi mahdollisesti johtaa harhaan, kun otantakehyksissä arvioidaan yhteyksiä sairaalapotilaisiin, sillä monissa maissa etniset vähemmistöryhmät ovat yliedustettuina, koska etniset terveyserot ovat yleisiä ja hyvin dokumentoituja. Lisäksi etniset vähemmistöryhmät ovat todennäköisemmin keskeisiä työntekijöitä, jotka altistuvat todennäköisemmin COVID-1942-taudille. Kulttuuriympäristö (mukaan lukien systeeminen rasismi) ja kielimuurit voivat vaikuttaa kielteisesti sekä testaukseen että vapaaehtoiseen osallistumiseen43. Etnisiä vähemmistöryhmiä voi olla vaikeampi rekrytoida tutkimuksiin edes tietyllä alueella44, ja ne voivat vaikuttaa otoksen edustavuuteen. Etniset vähemmistöt eivät todennäköisesti raportoineet testatuksi tulemisesta Yhdistyneen kuningaskunnan Biopankin tietojen analyysissä, jossa yksi vahvimmista testiin liittyvistä tekijöistä oli ensimmäinen geneettinen pääkomponentti, joka on esi-isien merkkiaine (laatikko 3). Näin ollen tämä voisi esiintyä kuten edellä, jossa etnisten vähemmistöjen esittäminen terveydenhuollolle olisi ehdollista vaikeammille oireille.

heikko: Määritelty tässä suurempi alttius haitallisia COVID-19 tuloksia, heikko on todennäköisemmin läsnä tietyissä väestöryhmissä, kuten iäkkäät aikuiset pitkäaikaishoidossa tai avustetun asumisen tilat, joilla on ennestään sairauksia, lihavia ryhmiä, ja tupakoitsijat. Nämä tekijät ennustavat todennäköisesti vahvasti sairaalahoitoa. Samalla COVID-19-infektio ja vakavuus todennäköisesti vaikuttavat sairaalahoitoon 8,9,10,45, eli näiden tekijöiden tutkiminen sairaalapotilailla voi aiheuttaa törmäysharhaa. Lisäksi ryhmiä voidaan kohdella eri tavoin COVID-19-taudin raportoinnissa eri maissa 46. Esimerkiksi Britanniassa varhaiset raportit “COVID-19: n” aiheuttamista kuolemista ovat saattaneet sekoittua kuolemiin “COVID-19: n tartunnan”47. Riskiryhmiin kuuluvat henkilöt joutuvat yleensä todennäköisemmin testattaviksi, mutta tietyt riskiryhmiin kuuluvat väestöryhmät, kuten pitkäaikaishoidossa tai tukiasunnoissa olevat henkilöt, ovat olleet vähemmän todennäköisiä monien tutkimuksi46. Hauraus ennustaa myös sairaalahoitoa eri ryhmissä, esimerkiksi vanhempaa henkilöä, jolla on hyvin vakavia COVID-19-oireita avusteisessa hoitolaitoksessa, ei saa viedä sairaalaan, jossa nuorempi yksilö olisi 48.

asuinpaikka ja sosiaalinen yhteys: otoksen valintaan vaikuttaa todennäköisesti useita etäisempiä tai epäsuorempia vaikutuksia. Ihmiset, joilla on paremmat mahdollisuudet käyttää terveyspalveluja, saattavat joutua testiin todennäköisemmin kuin ne, joilla on heikommat mahdollisuudet käyttää niitä. Niillä alueilla,joilla on enemmän lääkäripalveluja tai paremmat julkiset liikenneyhteydet, voi olla helpompi päästä testattavaksi, kun taas niillä alueilla, joilla on vähemmän lääkäripalveluja, voidaan todennäköisemmin joutua testattavaksi49. Ihmiset, jotka asuvat alueilla, joilla on vahvemmat alueelliset tai sosiaaliset siteet olemassa oleviin tautitapauksiin, saattavat myös olla todennäköisemmin testattavia, koska lääketieteellinen valppaus kyseisillä alueilla on lisääntynyt. Myös perheen ja yhteisön tukiverkostot todennäköisesti vaikuttavat hoitoon pääsyyn, sillä esimerkiksi hoitovastuussa olevat ja heikot tukiverkostot voivat hakeutua heikommin lääkäriin. Konnektiivisuus on ehkä todennäköisintä, että otantakehysten testaus on vinoutunutta, sillä testauksen ehtona on tietoisuus ja saatavuus. Se voi kuitenkin myös harhauttaa kaikkia kolmea suurta näytteenottokehystä samankaltaisen mekanismin kautta oireiden tunnistamiseen.

Internet-yhteys ja teknologinen sitoutuminen: Tämä vinouttaa ensisijaisesti vapaaehtoista rekrytointia sovellusten kautta, vaikka se voi liittyä myös lisääntyneeseen tietoisuuteen ja bias-testaukseen oireiden tunnistamisreitin kautta. Internet-sovellusten kautta tapahtuvan otantarekrytoinnin tiedetään aliedustavan tiettyjä ryhmiä32,51. Lisäksi tämä vaihtelee otantasuunnittelun mukaan, jolloin vapaaehtoisten tai “pull-in” – tiedonkeruumenetelmien on osoitettu tuottavan enemmän sitoutuneita mutta vähemmän edustavia otoksia kuin mainoksiin perustuvat tai “push out” – menetelmät33. Näillä aktiivisemmilla ryhmillä on todennäköisesti paremmat mahdollisuudet käyttää sähköisiä tiedonkeruumenetelmiä ja osallistua enemmän sosiaalisen median kampanjoihin, joiden tarkoituksena on rekrytoida osallistujia. Näin ollen nuoret ovat todennäköisemmin yliedustettuina sovelluspohjaisissa vapaaehtoisissa osallistumistutkimuksissa29.

lääketieteellinen ja tieteellinen kiinnostus: tutkimukset, joissa otetaan vapaaehtoisia näytteitä, voivat olla puolueellisia, koska niissä on todennäköisesti suhteettoman paljon ihmisiä, joilla on vahva lääketieteellinen tai tieteellinen kiinnostus. On todennäköistä, että näillä henkilöillä itsellään on suurempi terveystietoisuus, terveempi käyttäytyminen, enemmän koulutusta ja korkeampi tulot31,52.

monet tässä kuvatuista testattavista tai tietokokonaisuuksiin sisällytettävistä tekijöistä käyvät ilmi Yhdistyneen kuningaskunnan Biopankin testitulosten analyysistä (laatikko 3). Keskeinen viesti on, että kun otosrekrytointi ei ole satunnaista, on uskomattoman laaja valikoima tapoja, joilla se ei-satunnaisuus voi heikentää tutkimustuloksia.

menetelmät törmäysharhojen vaikutusten havaitsemiseksi ja minimoimiseksi

tässä osiossa kuvataan menetelmiä, joilla joko käsitellään törmäysharhoja tai arvioidaan tulosten herkkyyttä törmäysharhoille. Kuten sekoittavien bias, se ei yleensä ole mahdollista osoittaa, että jokin menetelmistä on voittanut törmäyttimen bias. Siksi herkkyysanalyysit ovat ratkaisevia tutkittaessa johtopäätösten luotettavuutta uskottaviin valintamekanismeihin18,19.

yksinkertainen, kuvaava menetelmä otoksen valinnasta aiheutuvan törmäysharhojen todennäköisyyden ja laajuuden arvioimiseksi on verrata otoksen muuttujien keskiarvoja, variansseja ja jakaumia kohdepopulaation (tai kohdepopulaation edustavan otoksen)16 muuttujiin. Näin saadaan tietoa otokseen valittujen henkilöiden profiilista kiinnostavasta kohdepopulaatiosta, kuten siitä, ovatko he yleensä vanhempia tai onko heillä muita sairauksia. Erityisen arvokasta on raportoida analyysin keskeisten muuttujien Vertailut, kuten oletettu riskitekijä ja tulos, sekä muut näihin liittyvät muuttujat. COVID-19-tautiriskin analysoinnissa yksi merkittävä este tälle pyrkimykselle on se, että useimmissa tapauksissa tartunnan todellista esiintyvyyttä väestössä ei tunneta. Vaikka on rohkaisevaa, jos otosarviot vastaavat väestötason vastaavia arvoja, on tärkeää tunnustaa, että tämä ei todista lopullisesti törmäyttimen bias53 puuttumista. Tämä johtuu siitä, että valintaan vaikuttavat tekijät voivat olla tutkimuksessa mittaamattomia, tai tekijät vaikuttavat valintaan ja jäävät havaitsematta, kun verrataan marginaalijakaumia.

kunkin menetelmän sovellettavuus riippuu ratkaisevasti tiedoista, joita on saatavilla osallistujista, jotka eivät ole mukana. Nämä menetelmät voidaan yleisesti ottaen jakaa kahteen luokkaan saatavilla olevien tietojen perusteella: sisäkkäisiin ja sisäkkäisiin näytteisiin. Sisäkkäisellä otoksella tarkoitetaan tilannetta, jossa keskeiset muuttujat mitataan vain muuten edustavan “superotoksen” osajoukosta, jolloin analyysi on rajoitettava tähän alaotokseen. Tätä määritelmää lähellä oleva esimerkki on osanäyte henkilöistä, jotka ovat saaneet COVID-19-testin pesiytyneenä Yhdistyneen kuningaskunnan Biopankkikohorttiin (on kuitenkin selvää, että Yhdistyneen kuningaskunnan Biopankkikohortti on itse ei-satunnaisesti sampedoitu 16). Sisäkkäisten näytteiden osalta tutkijat voivat hyödyntää edustavan supernäytteen tietoja. Sisäkkäisellä otoksella tarkoitetaan tilannetta, jossa tietoja on saatavilla vain edustamattomasta otoksesta. Esimerkkinä tästä ovat sairaalahoitoon joutuneilta otetut näytteet, joissa ei ole tietoa sairaalahoitoon joutuneista henkilöistä. On tyypillisesti haastavampaa käsitellä törmäyttimen vinoumaa ei-sisäkkäisissä näytteissä. Lisähuomautuksessa 1 esitetään ohjattu analyysi, joka havainnollistaa molempia HERKKYYSANALYYSITYYPPEJÄ käyttäen Yhdistyneen kuningaskunnan Biopankin COVID-19-testaustietoja.

sisäkkäiset näytteet: Käänteinen todennäköisyyspainotus on tehokas ja joustava tapa säätää törmäyttimen vinoumaa sisäkkäisissä näytteissä54,55. Riskitekijän syy-seuraus-vaikutus tulokseen arvioidaan painotetun regression avulla siten, että osallistujat, jotka ovat yliedustettuina alaotoksessa, painotetaan alaspäin ja osallistujat, jotka ovat aliedustettuina, painotetaan ylöspäin. Käytännössä nämä painot muodostetaan estimoimalla eri yksilöiden todennäköisyys tulla valituksi otokseen edustavasta supernäytteestä niiden mitattujen kovariaattien56 perusteella. Voisimme esimerkiksi käyttää koko Yhdistyneen kuningaskunnan Biopankin näytteestä saatuja tietoja COVID-19-testin todennäköisyyden arvioimiseen ja käyttää näitä painoja analyyseissä, jotka on rajoitettava testattujen henkilöiden osanäytteeseen (esim.positiivisten testauksen riskitekijöiden tunnistaminen). Seaman ja White antavat yksityiskohtaisen yleiskatsauksen käänteisen todennäköisyyspainotuksen käytännön näkökohdista ja oletuksista, kuten “otosvalintamallin” oikea määrittely (tilastollinen malli mitattujen kovariaattien ja otokseen valinnan välisestä suhteesta, jota käytetään näiden painojen muodostamiseen), muuttuva valinta ja lähestymistavat epävakaiden painojen (eli nollan tai nollan lähellä olevien painojen) käsittelyyn.

toinen oletus käänteisessä todennäköisyyspainotuksessa on, että jokaisella kohdepopulaation yksilöllä on oltava nollasta poikkeava todennäköisyys tulla valituksi otokseen. Tätä olettamusta tai olettamusta siitä, että valintamalli on määritetty oikein, ei voida testata pelkästään havainnoiduilla tiedoilla. Käsitteellisesti liittyvä lähestymistapa, käyttäen propensity pisteet matching, käytetään joskus välttää indeksitapahtuma bias57, 58. On myös olemassa herkkyysanalyysejä todennäköisyyspainojen virheellisestä määrittelystä. Esimerkiksi Zhao et al. kehitetään herkkyysanalyysi sille, missä määrin arvioidut todennäköisyyspainot eroavat todellisista havaitsemattomista painoista59. Tämä lähestymistapa on erityisen hyödyllinen, kun voimme arvioida todennäköisyyspainot mukaan lukien joitakin, mutta ei välttämättä kaikkia, asiaankuuluvia ennusteita otoksen sisällyttämisestä. Voisimme esimerkiksi arvioida painoja COVID-19-testin saamisen todennäköisyydelle Britannian Biopankkiin osallistuneiden keskuudessa, mutta meiltä puuttuvat Keskeiset ennustajat, kuten oireiden esittäminen ja terveydenhuoltoon hakeutumisen mittarit.

pesimättömät näytteet: Kun meillä on tietoa vain TUTKIMUSNÄYTTEESTÄ (esim.vain tiedot osallistujista, jotka testattiin COVID-19: n varalta), valintamallia ei ole mahdollista arvioida suoraan, koska valitsematta jääneitä (testaamattomia) henkilöitä ei havaita. Sen sijaan on tärkeää käyttää herkkyysanalyysejä sen todennäköisyyden arvioimiseksi, että näytteen valinta aiheuttaa törmäysharhaa.

Bounds and parameter search: Törmäyttimen vinouman laajuus on mahdollista päätellä, kun otetaan huomioon riskitekijän ja tuloksen todennäköinen koko ja suunta otoksen valinnassa (riippumatta siitä, ovatko nämä suoria vai muita tekijöitä) 19,60,61. Tämä lähestymistapa riippuu kuitenkin siitä, onko koko ja suunta oikea, eikä muita valintaan vaikuttavia tekijöitä ole. Siksi on tärkeää tutkia erilaisia mahdollisia otoksen valintamekanismeja ja tutkia niiden vaikutusta tutkimuksen johtopäätöksiin. Loimme näiden oletusten ohjaaman yksinkertaisen verkkosovelluksen, jonka avulla tutkijat voivat tutkia yksinkertaisia valintamalleja, joita tarvittaisiin havaitsevan assosiaation aikaansaamiseksi: http://apps.mrcieu.ac.uk/ascrtain/. Kuvassa. 4 käytämme äskettäin raportin suojaavan yhdistyksen tupakoinnin COVID-19 infection45 tutkia suuruus törmäyttimen bias, joka voidaan indusoida koska valittu näytteenotto, alle nollahypoteesi ei ole syy-vaikutus.

Kuva. 4: Esimerkki törmäysharhojen aiheuttamista laajoista yhteenliittymistä nollahypoteesin eli syy-seuraussuhteen puuttuessa käyttäen samanlaisia skenaarioita kuin mitä raportoitiin COVID-19-tartunnan tupakoinnin havaitusta suojaavasta yhteydestä.
kuva4

oletetaan yksinkertainen skenaario, jossa hypoteettinen altistus (A) ja tulos (Y) ovat molemmat binäärisiä ja jokainen vaikutustodennäköisyys tulla valituksi otokseen (otoksiin) esim. \(P(S = 1|A,Y) = \beta _0 + \beta _A + \beta _Y + \beta _{AY}\) missä \(\beta _0\) on perustason todennäköisyys tulla valituksi, \(\beta _A\) on a: n vaikutus, \(\beta _Y\) on Y: n vaikutus ja \(\beta _{ay}\) on a: n ja Y: n välisen vuorovaikutuksen vaikutus.kyseinen valintamekanismi esitetään kuvassa. 1b (ilman vuorovaikutustermin piirtämistä). Tämä kuvaaja osoittaa, mitä näiden parametrien yhdistelmiä tarvitaan ilmeisen riskivaikutuksen, jonka suuruus on > 2 (sininen alue), tai näennäisen suojaavan vaikutuksen, jonka suuruus on < 0.5 (punainen alue) nollahypoteesin mukaan61. Luoda yksinkertaistettu skenaario samanlainen kuin miyara et al. käytämme yleistä tupakoinnin yleisyyttä väestössä 0,27 ja otoksen esiintyvyyttä 0,05, jolloin \(\beta _A\) on 0,22. Koska COVID-19: n esiintyvyyttä ei tunneta yleisväestössä, Sallimme otoksen olevan yli – tai aliedustava (y-akseli). Sallimme myös vaatimattomat vuorovaikutusvaikutukset. Kun lasketaan tämän parametriavaruuden yli, 40% kaikista mahdollisista yhdistelmistä johtaa artefaktuaaliseen 2-kertaiseen suojaavaan tai riskialttiiseen assosiaatioon, joka toimii pelkästään tämän yksinkertaisen bias-mallin kautta. On tärkeää paljastaa tämä epävarmuustaso julkaistaessa havaintoarvioita.

myös useita muita lähestymistapoja on toteutettu käteviin verkkosovelluksiin (“Appendix”). Esimerkiksi Smith ja VanderWeele ehdottivat herkkyysanalyysia, jonka avulla tutkijat voivat sitoa estimaattejaan määrittämällä herkkyysparametrit, jotka edustavat otoksen valinnan vahvuutta (suhteellisten riskisuhteiden osalta). Ne antavat myös “e-arvon”, joka on näiden parametrien pienin suure, joka selittäisi havaitun assosiaation62. Aronow ja Lee ehdottivat herkkyysanalyysia otosten keskiarvoille, jotka perustuvat käänteiseen todennäköisyyspainotukseen sisäkkäisissä näytteissä, joissa painoja ei voida arvioida, mutta niiden oletetaan rajoittuvan kahden tutkijan määrittämän arvon välillä63. Tämä työ on yleistetty regressiomalleiksi, jolloin kohdepopulaatiota koskevat olennaiset ulkoiset tiedot (esim.väestölaskennan yhteenvetotilastot) voidaan ottaa mukaan 64. Näiden herkkyysanalyysien avulla tutkijat voivat tutkia, onko olemassa uskottavia törmäyttäjärakenteita, jotka voisivat selittää pois havaitsevia assosiaatioita. Ne eivät kuitenkaan edusta kattavaa mallikokoelmaa, joka voisi johtaa harhaan, eivätkä ne välttämättä todista, vaikuttaako törmäysharha tuloksiin. Jos valinnan riskitekijä on itse seurausta ylävirtaan liittyvistä syistä, on tärkeää, että otetaan huomioon näiden ylävirtaan suuntautuvien valintavaikutusten vaikutus (eli ei ainoastaan se, miten riskitekijä vaikuttaa valintaan, vaan myös se, miten riskitekijän syyt ja/tai tuloksen syyt vaikuttavat valintaan, esim.Fig. 2b). Vaikka nämä ylävirtaan syyt voivat erikseen olla pieni vaikutus valintaan, on mahdollista, että paljon tekijöitä erikseen pieniä vaikutuksia voisi yhdessä olla suuri valinta vaikutus ja käyttöön collider bias65.

negatiiviset kontrollianalyysit: jos valitussa näytteessä on mitattuja tekijöitä, joilla ei tiedetä olevan vaikutusta lopputulokseen,näiden tekijöiden yhdistämistä valitun otoksen tulokseen voidaan pitää negatiivisena kontrollina66, 67. Kielteisten valvontayhdistysten olisi sen vuoksi oltava mitättömiä, ja ne ovat siksi hyödyllisiä valinnan tueksi esitettävien todisteiden välineinä. Jos havaitsemme assosiaatioita,joiden magnitudi on odotettua suurempi, tämä osoittaa, että näyte valitaan sekä negatiivisella kontrollilla että tuloksella interest68, 69.

Korrelaatioanalyysit: kun otos valitaan, kaikki valintaan vaikuttaneet piirteet korreloituvat otoksen sisällä (paitsi erittäin epätodennäköisessä tapauksessa, että syyt ovat täysin multiplikatiivisia). Testaamalla korrelaatioita oletettujen riskitekijöiden välillä silloin, kun oletetaan, että yhteyttä ei ole, voidaan osoittaa otantavalinnan esiintyminen ja suuruus ja siten todennäköisyys, että törmäysharha vääristää primaarianalyysia70.

vaikutukset

suurin osa COVID-19-pandemian aikaiseen politiikkaan ja kliiniseen päätöksentekoon liittyvästä tieteellisestä todistusaineistosta on peräisin havaintotutkimuksista71. Olemme havainnollistaneet, miten nämä havainnolliset tutkimukset ovat erityisen alttiita ei-satunnaisotannille. Satunnaistetut kliiniset tutkimukset antavat kokeellista näyttöä hoidosta, mutta kokeelliset tutkimukset infektiosta eivät ole mahdollisia eettisistä syistä. Törmäysharhojen vaikutus havaitsevista tutkimuksista tehtyihin päätelmiin voi olla huomattava, ei ainoastaan taudinsiirtomallinnuksissa72,73, vaan myös kausaalisessa päättelyssä7 ja ennustemallinnuksessa2.

vaikka on olemassa monia lähestymistapoja, joilla pyritään ratkaisemaan törmäysharhojen ongelma, ne perustuvat todistamattomiin oletuksiin. Otoksen valinnan laajuutta on vaikea tietää, ja vaikka se olisikin tiedossa, ei voida todistaa, että se olisi täysin otettu huomioon millään menetelmällä. Luotettavan näytön saamiseksi tarvitaan kiireellisesti edustavia populaatiotutkimuksia34 tai näytteenottostrategioita, joilla vältetään törmäyttimen bias74 ongelmat. Tutkijoiden ja poliittisten päättäjien olisi suhtauduttava varovaisesti sellaisten näytteiden tuloksiin, jotka eivät todennäköisesti edusta kohdepopulaatiota.

Vastaa

Sähköpostiosoitettasi ei julkaista.