az ütköző torzítás aláássa a COVID-19 betegség kockázatának és súlyosságának megértését
miért a megfigyelési COVID-19 kutatás különösen érzékeny az ütköző elfogultságára
bár kétségtelenül értékes, a megfigyelési adatkészletek egyfajta fekete doboz lehetnek, mert a bennük becsült asszociációk sokféle mechanizmusnak köszönhetők. Tekintsük azt a forgatókönyvet, amelyben meg akarjuk becsülni egy olyan kockázati tényező okozati hatását, amely általánosítható egy szélesebb populációra, például az Egyesült Királyságra (a “célpopulációra”). Mivel ritkán figyeljük meg a teljes célpopulációt, meg kell becsülnünk ezt a hatást az ebből a populációból vett egyének mintáján belül. Ha a minta valódi véletlenszerű kiválasztás a populációból, akkor azt mondjuk, hogy reprezentatív. Gyakran azonban a mintákat kényelemből választják ki, vagy azért, mert a kockázati tényezőt vagy az eredményt csak bizonyos csoportokban mérik (pl. A COVID-19 betegség állapotát csak azoknál az egyéneknél figyelik meg, akik tesztet kaptak). Továbbá, a mintában való részvételre meghívott személyek megtagadhatják vagy később lemorzsolódhatnak. Ha a minta felvételéhez kapcsolódó jellemzők a kockázati tényezőhöz és az érdeklődés kimeneteléhez is kapcsolódnak, akkor ez bevezeti az ütköző elfogultságának lehetőségét elemzésünkben.
az ütköző torzítása nem csak a mintavétel helyén fordul elő. Statisztikai modellezési lehetőségekkel is bevezethető. Például, hogy helyénvaló-e a kovariánsokhoz igazodni a megfigyelési asszociációkban,attól függ,hogy a kovariánsok hol helyezkednek el az ok-okozati úton,és milyen szerepet játszanak az adatgeneráló folyamatban18, 19, 20, 21. Ha feltételezzük, hogy egy adott kovariáns befolyásolja mind a feltételezett kockázati tényezőt, mind az eredményt (zavaró), helyénvaló feltételezni, hogy a kovariáns eltávolítja a zavaró szerkezet által kiváltott torzítást. Ha azonban a kovariáns az expozíció egyik vagy mindkét következménye, valamint az eredmény (ütköző), nem pedig közös ok (zavaró), akkor a kovariánson történő kondicionálás az elfogultság csökkentése helyett előítéleteket idézhet elő22, 23, 24. Ez azt jelenti, hogy az ütköző torzítás akkor is bevezethető, ha statisztikai kiigazításokat végeznek a kockázati tényező és az eredmény közötti ok-okozati úton fekvő változók esetében. A változók mögöttes ok-okozati szerkezetének előzetes ismerete, valamint az, hogy ezek a kockázati tényező és az eredmény közös okaként vagy következményeként működnek-e az adatgeneráló folyamatban, nehéz lehet következtetni. Ezért helyénvaló az ütköző elfogultságát a zavaró elfogultsághoz hasonló óvatossággal kezelni. Ennek módjaival később foglalkozunk ebben a cikkben (“módszerek az ütköző elfogultságának észlelésére és minimalizálására”).
többféle módon gyűjtenek adatokat a COVID-19-ről, amelyek nem szándékos kondicionálást vezethetnek be a kiválasztott mintában. A felvett résztvevők jellemzői számos tényezőhöz kapcsolódnak, beleértve a politikai döntéseket, a költségkorlátozásokat, a technológiai hozzáférést és a tesztelési módszereket. Széles körben elismert az is, hogy a betegség valódi prevalenciája a populációban továbbra sem ismert25. Itt leírjuk a COVID-19 adatgyűjtésének formáit, mielőtt részleteznénk a COVID-19 körülményeit, amelyek elemzését érzékenyvé teszik az ütközők elfogultságára.
COVID-19 mintavételi stratégiák és eset/kontroll meghatározások
mintavétel önkéntes részvételhez kötött (Esetmeghatározás: valószínű COVID-19, kontroll meghatározás: önkéntes résztvevő, aki nem jelentette a COVID-19 tüneteit, ábra. 2a): a valószínű COVID-19 státusz önkéntes részvételt igénylő tanulmányokkal határozható meg. Ezek közé tartozhatnak például a meglévő kohorsz és longitudinális tanulmányok által végzett felmérések26,27, Az egyes kohorsz tanulmányokban, például az Egyesült Királyság Biobankjában rendelkezésre álló adminisztratív nyilvántartásokhoz való adatkapcsolat28,vagy a mobiltelefon-alapú alkalmazásprogramok29, 30. A tudományos vizsgálatokban való részvétel erősen nem véletlenszerű (pl. a résztvevők aránytalanul nagy valószínűséggel magasan képzettek, egészségtudatosak és nemdohányzók), így az önkéntesek ezekben a mintákban valószínűleg jelentősen eltérnek a célcsoporttól31, 32, 33. Lásd a 2. Háttérmagyarázatot és az ábrát. 3 egy matrica, hogy egy study30 feltárt ütköző elfogultság ebben az összefüggésben.
Minta kiválasztási nyomás a COVID-19 vizsgálatokhoz
a fenti mintavételi stratégiákat három elsődleges mintavételi keretbe rétegezhetjük. E keretek közül az első az önkéntes részvételen alapuló mintavétel, amely eredendően nem véletlenszerű a részvételt befolyásoló tényezők miatt. Ezek közül a második a mintavételi keretek a COVID-19 tesztelési eredmények felhasználásával. Néhány figyelemre méltó kivételtől eltekintve(pl. 3,34), a COVID-19 populációs tesztelését általában nem véletlenszerű mintákban végzik. E keretek közül a harmadik a kórházi betegeken alapuló mintavétel, COVID-19-vel vagy anélkül. Ez ismét szükségszerűen nem véletlenszerű, mivel a kórházi felvétel feltételei.
3.rovat és ábra. 3. mutassa be a minta kiválasztási nyomását kiváltó tényezők szélességét. Míg a mintavételi folyamatokat befolyásoló tényezők egy része közös lehet a fent felsorolt összes mintavételi módban, néhány mód specifikus lesz. Ezek a tényezők valószínűleg eltérnek attól, hogy hogyan működnek a nemzeti és az egészségügyi rendszer összefüggéseiben. Itt felsorolunk egy sor lehetséges szelekciós nyomást, valamint azt, hogy ezek hogyan befolyásolják a különböző COVID-19 mintavételi kereteket. Leírjuk az esetek azonosítását/meghatározását is, és részletesen leírjuk, hogyan torzíthatják a következtetéseket, ha feltáratlanok maradnak.
tünetek súlyossága: Ez elképzelhető módon torzítja mind a három fő mintavételi keretet, bár a legegyszerűbben a tesztelés összefüggésében érthető. Számos ország elfogadta azt a stratégiát, hogy a teszteket elsősorban olyan betegek számára ajánlják fel, akiknél a tünetek elég súlyosak ahhoz, hogy orvosi ellátást igényeljenek, pl. kórházi kezelés, mint az Egyesült Királyságban 2020 április végéig történt. Ezért a populációban sok valódi pozitív eset észrevétlen marad, és kevésbé valószínű, hogy a minta részét képezi, ha a beiratkozás a teszt állapotától függ. A tünetmentes vírushordozók vagy az atipikus megjelenésű esetek magas aránya tovább súlyosbítja ezt a kérdést.
Tünetfelismerés: ez mind a három mintavételi keretet torzítja, mivel az összes mintába való belépés a tünetek felismerésétől függ. A tünetek súlyosságától függően, de attól eltérően a COVID-19 tesztelés a tünetek felismerésétől függően változik35. Ha az egyén nem ismeri fel a helyes tüneteket, vagy úgy ítéli meg, hogy a tünetei nem súlyosak, egyszerűen utasítást kaphat arra, hogy elszigetelje magát, és ne kapjon COVID-19 tesztet. Az egyének másként fogják értékelni tüneteik súlyosságát; az egészséggel kapcsolatos szorongásban szenvedők nagyobb valószínűséggel jelentik túl a tüneteket, míg azok, akiknek kevesebb információjuk van a pandémiáról vagy az egészségügyi tanácsokhoz való hozzáférésről, alulreprezentáltak lehetnek. Ez funkcionálisan a hamis negatívok differenciált arányaként fog működni az egyének között a tünetek felismerése alapján, ami következményes lehet a tünetmentes esetek és az átvitel magas becslésében36. A tünetekre vonatkozó irányelvek megváltoztatása valószínűleg súlyosbítja ezt a problémát, ami szisztematikus kapcsolatokat idézhet elő a tünetek bemutatása és a tesztelés között35,37. Itt az alacsonyabb tudatosságú csoportok (például a nem megfelelő nyilvános üzenetküldés vagy a nyelvi akadályok miatt) magasabb küszöbértékekkel rendelkezhetnek a teszteléshez, ezért azok, akik pozitív eredményt mutatnak, nagyobb kockázatot jelentenek a súlyos COVID-19 kimenetelekre.
foglalkozás: a COVID-19-nek való kitettség a foglalkozás szempontjából mintázott. Számos országban a frontvonalbeli egészségügyi dolgozókat sokkal nagyobb valószínűséggel vizsgálják meg a COVID-19 szempontjából,mint az Általános lakosság5, 38 a vírushoz való közelségük és a fertőzéssel kapcsolatos átvitel lehetséges következményei39 miatt. Mint ilyenek, erősen felülreprezentáltak lesznek a mintákban a teszt állapotától függően. Más kulcsfontosságú munkavállalóknak nagy a fertőzésveszélye a nem kulcsfontosságú munkavállalókhoz viszonyított nagyszámú kapcsolat miatt, ezért felülreprezentálódhat a mintákban a pozitív tesztállapot vagy a COVID-hez kapcsolódó halál függvényében. Az ilyen foglalkozásokkal kapcsolatos bármely tényező (pl. etnikai hovatartozás, társadalmi-gazdasági helyzet, életkor és kiindulási egészség) ezért a minta kiválasztásához is társul. A 2b. ábra egy olyan példát mutat be, ahol a feltételezett kockázati tényezőnek (dohányzás) nem kell okozati összefüggésben befolyásolnia a minta kiválasztását (kórházi betegek), egyszerűen összefüggésbe hozható a kockázati tényező és a minta kiválasztása közötti zavar miatt (egészségügyi dolgozó).
etnikum: az etnikai kisebbségek is nagyobb valószínűséggel fertőződnek meg a COVID-1940-vel. A kedvezőtlen COVID-19 eredmények jelentősen rosszabbak egyes etnikai kisebbségek egyénei számára41. Ez elképzelhető, hogy torzítja a becsült asszociációkat a kórházi betegeken alapuló mintavételi kereteken belül, mivel sok országban az etnikai kisebbségi csoportok felülreprezentáltak, mivel az etnikai egyenlőtlenségek az egészségben átfogóak és jól dokumentáltak. Ezenkívül az etnikai kisebbségi csoportok nagyobb valószínűséggel kulcsfontosságú munkavállalók, akik nagyobb valószínűséggel vannak kitéve a COVID-1942-nek. A kulturális környezet (beleértve a rendszerszintű rasszizmust) és a nyelvi akadályok negatívan befolyásolhatják a tanulmányokba való belépést, mind a tesztelésen, mind az önkéntes részvételen alapulva43. Az etnikai kisebbségi csoportokat nehezebb lehet bevonni a tanulmányokba, még egy adott területen belül is44, és ez befolyásolhatja a minta reprezentativitását. Az etnikai kisebbségek kevésbé számoltak be tesztelésükről az Egyesült Királyság Biobank adatainak elemzése során, ahol a teszteléshez kapcsolódó egyik legerősebb tényező az első genetikai főkomponens volt, amely az ősök markere (3.Háttérmagyarázat). Így ez a fentiek szerint jelentkezhet, az etnikai kisebbségek orvosi ellátáshoz való hozzáférése súlyosabb tünetektől függ.
gyengeség: Az itt definiált nagyobb érzékenység a kedvezőtlen COVID-19 eredményekre, a törékenység nagyobb valószínűséggel van jelen a lakosság bizonyos csoportjaiban, például idősebb felnőttek hosszú távú gondozásban vagy segített életvitelben, már meglévő egészségügyi állapotokkal, elhízott csoportokkal és dohányosokkal. Ezek a tényezők valószínűleg erősen megjósolják a hospitalizációt. Ugyanakkor a COVID-19 fertőzés és súlyossága valószínűleg befolyásolja a kórházi kezelést8,9,10,45, ami azt jelenti, hogy ezeknek a tényezőknek a vizsgálata a kórházi betegeknél ütköző elfogultságot okozhat. Ezenkívül a csoportokat eltérő módon lehet kezelni a COVID-19-ről szóló jelentések tekintetében a különböző országokban46. Például az Egyesült Királyságban a “COVID-19 miatt” bekövetkezett halálesetekről szóló korai jelentések összetéveszthetők a “covid-19″fertőzéssel fertőzött halálesetekkel” 47. A magas kockázatú egyéneket általában nagyobb valószínűséggel vizsgálják, de számos tanulmány kevésbé valószínű, hogy a magas kockázatú demográfiai csoportokból, például a hosszú távú gondozásban vagy a támogatott életkörülményekben élőkből mintát vesznek46. A törékenység a kórházi kezelést is eltérő módon jósolja a különböző csoportok között, például egy idős, nagyon súlyos COVID-19 tünetekkel rendelkező személyt egy segített életvitelben nem lehet kórházba vinni, ahol egy fiatalabb személy48.
lakóhely és társadalmi kapcsolat: valószínűleg számos, a minta kiválasztására gyakorolt távolabbi vagy közvetett hatás létezik. Azok az emberek, akik jobban hozzáférnek az egészségügyi szolgáltatásokhoz, nagyobb valószínűséggel tesztelhetők, mint azok, akik kevésbé hozzáférnek. Azok a területek, ahol nagyobb az orvosi szolgáltatások száma vagy jobb a tömegközlekedés, könnyebben hozzáférhetnek a vizsgálati szolgáltatásokhoz,míg azok a területek, ahol kevésbé férnek hozzá az orvosi szolgáltatásokhoz, nagyobb valószínűséggel kerülnek tesztelésre49. A meglévő járványokhoz erősebb térbeli vagy társadalmi kapcsolatokkal rendelkező területeken élő emberek szintén nagyobb valószínűséggel tesztelhetők az ezeken a területeken fokozott orvosi éberség miatt. A családi és közösségi támogató hálózatok valószínűleg befolyásolják az orvosi ellátáshoz való hozzáférést is, például a gondozási kötelezettséggel rendelkezők és a gyenge támogató hálózatok kevésbé tudnak orvoshoz fordulni50. A kapcsolódás talán a legvalószínűbb, hogy torzítja a mintavételi keretek tesztelését, mivel a tesztelés a tudatosságtól és a hozzáféréstől függ. Ez azonban torzíthatja mind a három fő mintavételi keretet a tünetek felismeréséhez hasonló mechanizmus révén.
Internet-hozzáférés és technológiai elkötelezettség: Ez elsősorban az alkalmazásokon keresztül történő önkéntes toborzást torzítja, bár a tünetek felismerésének útján történő fokozott tudatossággal és elfogultsági teszteléssel is társulhat. Ismert,hogy az internetes alkalmazásokon keresztül történő mintavétel bizonyos csoportokat alulreprezentál32, 51. Ezenkívül ez a mintavételi terv szerint változik, ahol az önkéntes vagy” behúzható ” adatgyűjtési módszerekről kimutatták, hogy elkötelezettebb, de kevésbé reprezentatív mintákat eredményeznek, mint a reklámalapú vagy a “kihúzható” módszerek33. Ezek az elkötelezettebb csoportok valószínűleg nagyobb hozzáféréssel rendelkeznek az elektronikus adatgyűjtési módszerekhez, és nagyobb elkötelezettséggel rendelkeznek a közösségi média kampányaiban, amelyek célja a résztvevők toborzása. Mint ilyen, a fiatalok nagyobb valószínűséggel túlreprezentáltak az alkalmazáson alapuló önkéntes részvételi tanulmányokban29.
orvosi és tudományos érdeklődés: az önkéntes mintákat toborzó tanulmányok elfogultak lehetnek, mivel valószínűleg aránytalanul sok olyan embert tartalmaznak, akik erős orvosi vagy tudományos érdeklődéssel rendelkeznek. Valószínű, hogy ezek az emberek maguk is nagyobb egészségtudatossággal, egészségesebb viselkedéssel, iskolázottsággal és magasabb jövedelemmel rendelkeznek31, 52.
az itt leírt vizsgálati vagy adatkészletekbe való felvétel számos tényezőjét alátámasztja az Egyesült Királyság Biobank-vizsgálati adatainak elemzése (3.Háttérmagyarázat). A legfontosabb üzenet az, hogy amikor a minta toborzása nem véletlenszerű, hihetetlenül széles körű módja van annak, hogy ez a nem véletlenszerűség aláássa a tanulmányi eredményeket.
módszerek az ütköző elfogultságának kimutatására és minimalizálására
ebben a szakaszban olyan módszereket ismertetünk, amelyek vagy az ütköző elfogultságának kezelésére vagy az eredmények érzékenységének értékelésére szolgálnak. A zavaró elfogultsághoz hasonlóan általában nem lehet bizonyítani, hogy bármelyik módszer legyőzte az ütköző elfogultságát. Ezért az érzékenységi elemzések döntő fontosságúak a valószínű szelekciós mechanizmusokra vonatkozó következtetések megalapozottságának vizsgálatában18, 19.
a mintaszelekció által kiváltott ütközési torzítás valószínűségének és mértékének értékelésére szolgáló egyszerű, leíró módszer a mintában lévő változók átlagának, varianciáinak és eloszlásának összehasonlítása a célpopulációban (vagy a célpopuláció reprezentatív mintájában)16. Ez információt nyújt az érdeklődésre számot tartó célpopulációból a mintába kiválasztott egyének profiljáról, például arról, hogy általában idősebbek-e, vagy nagyobb valószínűséggel vannak-e társbetegségeik. Különösen értékes ezeket az összehasonlításokat jelenteni az elemzés kulcsfontosságú változóira, például a feltételezett kockázati tényezőre és az eredményre, valamint az ezekhez kapcsolódó egyéb változókra vonatkozóan. A COVID-19 betegség kockázatának elemzése tekintetében ennek a törekvésnek az egyik fő akadálya az, hogy a legtöbb esetben a fertőzés tényleges prevalenciája az általános populációban ismeretlen. Bár biztató, ha a minta becslései megfelelnek a népességszint megfelelőinek, fontos felismerni, hogy ez nem bizonyítja egyértelműen az ütközési torzítások hiányát53. Ez azért van, mert a szelekciót befolyásoló tényezők nem mérhetők a vizsgálatban, vagy a tényezők kölcsönhatásba lépnek, hogy befolyásolják a szelekciót, és észrevétlenek maradnak a marginális eloszlások összehasonlításakor.
minden módszer alkalmazhatósága döntően a nem résztvevőkről rendelkezésre álló adatoktól függ. Ezek a módszerek a rendelkezésre álló adatok alapján nagyjából két kategóriába sorolhatók: beágyazott és nem beágyazott minták. A beágyazott minta arra a helyzetre utal, amikor a kulcsváltozókat csak egy egyébként reprezentatív “szuper minta” részhalmazán belül mérik, így arra kényszerítve az elemzést, hogy erre a részmintára korlátozódjon. Ehhez a meghatározáshoz közeli példa azoknak az egyéneknek az almintája, akik COVID-19 tesztet kaptak beágyazva az Egyesült Királyság Biobank kohorszába (bár egyértelmű, hogy az Egyesült Királyság Biobank kohorszja maga nem véletlenszerűen mintavételezett16). Beágyazott minták esetében a kutatók kihasználhatják a reprezentatív szupermintában rendelkezésre álló adatokat. A nem beágyazott minta arra a helyzetre utal, amikor az adatok csak nem reprezentatív mintában állnak rendelkezésre. Erre példa a kórházi személyek mintái, amelyekben nem állnak rendelkezésre adatok a nem kórházi személyekről. Általában nagyobb kihívást jelent az ütközők elfogultságának kezelése a nem beágyazott mintákban. A COVID-19 teszteléssel kapcsolatos Brit Biobank-adatok felhasználásával mindkét típusú érzékenységi elemzést bemutató irányított elemzést az 1.kiegészítő megjegyzés tartalmazza.
beágyazott minták: az inverz valószínűségi súlyozás hatékony és rugalmas megközelítés az ütközők torzításának beállításához a beágyazott mintákban54,55. A kockázati tényezőnek az eredményre gyakorolt okozati hatását súlyozott regresszióval becsülik meg, oly módon, hogy az almintában felülreprezentált résztvevőket lefelé, az alulreprezentált résztvevőket pedig felfelé súlyozzák. Gyakorlatban, ezeket a súlyokat úgy állítjuk össze, hogy megbecsüljük annak valószínűségét, hogy a reprezentatív szupermintából különböző egyedeket választanak ki a mintába mért kovariánsaik alapján56. Például felhasználhatjuk a teljes brit Biobank mintából származó adatokat annak becslésére, hogy az egyének megkapják-e a COVID-19 tesztet, és felhasználhatjuk ezeket a súlyokat olyan elemzésekben, amelyeket a tesztelt egyének részmintájára kell korlátozni (pl. a pozitív teszt kockázati tényezőinek azonosítása). A Seaman és White részletes áttekintést nyújt az inverz valószínűségi súlyozással kapcsolatos gyakorlati megfontolásokról és feltételezésekről, mint például a “minta kiválasztási modell” (a mért kovariánsok és a mintába történő kiválasztás közötti kapcsolat statisztikai modellje, amelyet e súlyok összeállításához használnak), a változó kiválasztás és az instabil súlyok (azaz a nulla vagy nullához közeli súlyok) kezelésének megközelítései.
az inverz valószínűségi súlyozás további feltételezése az, hogy a célpopuláció minden egyes egyedének nem nulla valószínűséggel kell kiválasztódnia a mintába. Sem ez a feltételezés, sem az a feltételezés, hogy a szelekciós modellt helyesen határozták meg, nem tesztelhető kizárólag a megfigyelt adatok felhasználásával. Koncepcionálisan összefüggő megközelítést alkalmaznak a hajlam pontszámok egyeztetésével, néha használják az indexes esemény torzításainak elkerülésére57, 58. Léteznek érzékenységi elemzések a valószínűségi súlyok helytelen meghatározására is. Például Zhao et al. érzékenységi elemzés kidolgozása annak megállapítására, hogy a becsült valószínűségi súlyok milyen mértékben különböznek a valódi, nem megfigyelt súlyoktól59. Ez a megközelítés különösen akkor hasznos, ha meg tudjuk becsülni a valószínűségi súlyokat, beleértve néhányat, de nem feltétlenül az összes, a minta felvételének releváns előrejelzői. Például meg tudnánk becsülni a COVID-19 teszt valószínűségének súlyát az Egyesült Királyság Biobank résztvevői között, azonban hiányoznak olyan kulcsfontosságú előrejelzők, mint a tünetek bemutatása és az egészségügyi kereső magatartás mérései.
nem beágyazott minták: Csak a COVID-19 szempontjából tesztelt résztvevőkre vonatkozó adatok) nem lehet közvetlenül megbecsülni a szelekciós modellt, mivel a nem kiválasztott (nem tesztelt) egyének nem figyelhetők meg. Ehelyett fontos érzékenységi elemzéseket alkalmazni annak a valószínűségnek a felmérésére, amelyet a minta kiválasztása indukál ütköző elfogultság.
határok és paraméterek keresése: Az ütközési torzítás mértékére következtetni lehet, ha ismerjük a kockázati tényező és a minta kiválasztására gyakorolt hatások valószínű nagyságát és irányát (függetlenül attól, hogy ezek közvetlenek vagy más tényezőkön keresztül)19,60,61. Ez a megközelítés azonban attól függ, hogy a méret és az irány helyes-e, és nincs-e más tényező, amely befolyásolná a kiválasztást. Ezért fontos megvizsgálni a különböző lehetséges mintavételi mechanizmusokat, és megvizsgálni azok hatását a tanulmány következtetéseire. Létrehoztunk egy egyszerű webes alkalmazást, amelyet ezek a feltételezések vezéreltek, hogy a kutatók egyszerű szelekciós mintákat fedezzenek fel, amelyekre szükség lenne egy megfigyelési asszociáció kiváltásához: http://apps.mrcieu.ac.uk/ascrtain/. Ábra. 4 a dohányzás védő Egyesületének nemrégiben készült jelentését használjuk a COVID-19 fertőzésről45, hogy feltárjuk a kiválasztott mintavétel miatt indukálható ütköző torzítás nagyságát, az ok-okozati hatás nélküli nullhipotézis alapján.
számos más megközelítést is megvalósítottak a kényelmes online webes alkalmazásokban (“függelék”). Smith és VanderWeele például egy érzékenységi elemzést javasolt, amely lehetővé teszi a kutatók számára, hogy becsléseiket a minta kiválasztásának erősségét képviselő érzékenységi paraméterek meghatározásával kössék össze (a relatív kockázati arányok tekintetében). Ezenkívül megadnak egy” E-értéket ” is, amely ezeknek a paramétereknek a legkisebb nagysága, amely megmagyarázná a megfigyelt asszociációt62. Aronow és Lee a minta átlagainak érzékenységi elemzését javasolta a nem beágyazott minták inverz valószínűségi súlyozása alapján, ahol a súlyokat nem lehet megbecsülni, de feltételezik, hogy két kutató által meghatározott érték között vannak korlátozva63. Ezt a munkát általánosították a regressziós modellekre, lehetővé téve a célpopulációra vonatkozó releváns külső információk (pl. a népszámlálás összefoglaló statisztikái) beépítését64. Ezek az érzékenységi elemzési megközelítések lehetővé teszik a kutatók számára, hogy feltárják, vannak-e hiteles ütköző struktúrák, amelyek megmagyarázhatják a megfigyelési asszociációkat. Ezek azonban nem jelentenek olyan kimerítő modelleket, amelyek elfogultságot eredményezhetnek, és nem feltétlenül bizonyítják, hogy az ütköző elfogultsága befolyásolja-e az eredményeket. Ha a szelekció kockázati tényezője maga is további upstream okok eredménye, akkor fontos figyelembe venni ezen upstream szelekciós hatások hatását (azaz nemcsak azt, hogy a kockázati tényező hogyan befolyásolja a szelekciót, hanem azt is, hogy a kockázati tényező okai és/vagy az eredmény okai hogyan befolyásolják a szelekciót pl. 2b). Bár ezek az upstream okok önmagukban kis hatással lehetnek a szelekcióra, lehetséges, hogy sok, egyenként kis hatású tényező együttesen nagy szelekciós hatást fejthet ki, és ütközési torzításokat eredményezhet65.
negatív kontroll elemzések: ha a kiválasztott mintában vannak olyan tényezők, amelyekről ismert, hogy nincsenek hatással az eredményre,akkor ezeknek a tényezőknek a tesztelése az eredményhez való kapcsolódás szempontjából a kiválasztott mintán belül negatív kontrollként szolgálhat66, 67. A negatív kontroll asszociációknak lényegében semmisnek kell lenniük, ezért hasznosak a kiválasztás alátámasztására szolgáló bizonyítékok szolgáltatásának eszközeként. Ha a vártnál nagyobb nagyságrendű asszociációkat figyelünk meg,akkor ez azt jelzi, hogy a mintát mind a negatív kontroll, mind a kamat eredményén kiválasztják68, 69.
korrelációs elemzések: fogalmilag hasonlóan a fenti negatív kontroll megközelítéshez, amikor egy mintát kiválasztanak, a szelekciót befolyásoló összes jellemző korrelál a mintán belül (kivéve azt a nagyon valószínűtlen esetet, amikor az okok tökéletesen multiplikatívak). Az olyan feltételezett kockázati tényezők közötti korrelációk vizsgálata, amelyekben várhatóan nincs összefüggés, jelezheti a mintavétel kiválasztásának jelenlétét és nagyságát, és így annak valószínűségét, hogy az ütközés torzítása torzítja az elsődleges elemzést70.
következmények
a COVID-19 világjárvány idején a politikát és a klinikai döntéshozatalt tájékoztató tudományos bizonyítékok többsége megfigyelési tanulmányokból származik71. Bemutattuk, hogy ezek a megfigyelési vizsgálatok különösen érzékenyek a nem véletlenszerű mintavételre. A randomizált klinikai vizsgálatok kísérleti bizonyítékot szolgáltatnak a kezelésre, de a fertőzés kísérleti vizsgálata etikai okokból nem lehetséges. Az ütközők torzításának hatása a megfigyelési vizsgálatokból származó következtetésekre jelentős lehet, nemcsak a betegségátviteli modellezés72,73, hanem az ok-okozati következtetések7 és az előrejelzési modellezés2 esetében is.
bár számos megközelítés létezik, amelyek megpróbálják enyhíteni az ütközők torzításának problémáját, bizonyíthatatlan feltételezésekre támaszkodnak. Nehéz megismerni a minta kiválasztásának mértékét, és még ha ez ismert is lenne, nem bizonyítható, hogy bármilyen módszerrel teljes mértékben elszámolták volna. A megbízható bizonyítékok szolgáltatásához sürgősen szükség van reprezentatív népességfelmérésekre34 vagy olyan mintavételi stratégiákra, amelyek elkerülik az ütközők elfogultságának problémáját74. A célpopulációra valószínűleg nem reprezentatív minták eredményeit a tudósoknak és a politikai döntéshozóknak óvatosan kell kezelniük.