Collider bias subminează înțelegerea noastră a riscului de boală COVID-19 și a severității

de ce cercetarea observațională COVID-19 este deosebit de susceptibilă la Collider bias

deși, fără îndoială, valoroase, seturile de date observaționale pot fi ceva de o cutie neagră, deoarece asociațiile estimate în cadrul acestora se pot datora multor mecanisme diferite. Luați în considerare scenariul în care dorim să estimăm efectul cauzal al unui factor de risc care este generalizabil pentru o populație mai largă, cum ar fi Marea Britanie (“populația țintă”). Deoarece rareori observăm populația țintă completă, trebuie să estimăm acest efect într-un eșantion de indivizi extrași din această populație. Dacă eșantionul este o adevărată selecție aleatorie din populație, atunci spunem că este reprezentativ. Adesea, totuși, eșantioanele sunt alese din comoditate sau pentru că factorul de risc sau rezultatul este măsurat numai în anumite grupuri (de ex. Starea bolii COVID-19 este observată numai pentru persoanele care au primit un test). În plus, persoanele invitate să participe la un eșantion pot refuza sau abandona ulterior. Dacă caracteristicile legate de includerea eșantionului se referă, de asemenea, la factorul de risc și rezultatul interesului, atunci aceasta introduce posibilitatea părtinirii colizorului în analiza noastră.

părtinirea colizorului nu are loc numai la punctul de eșantionare. Poate fi introdus și prin alegeri de modelare statistică. De exemplu,dacă este adecvată ajustarea pentru covariabile în asociațiile observaționale depinde de locul în care covariatele se află pe calea cauzală și de rolul lor în procesul de generare a datelor18,19,20, 21. Dacă presupunem că o covariată dată influențează atât factorul de risc ipotezat, cât și rezultatul (un confounder), este oportun să se condiționeze pe acea covariată să elimine prejudecata indusă de structura confuză. Cu toate acestea, dacă covariatul este o consecință a uneia sau a ambelor expuneri și a rezultatului (un colizor), mai degrabă decât a unei cauze comune (un confounder), atunci condiționarea covariatului poate induce, mai degrabă decât reduce,bias22,23, 24. Adică, părtinirea colizorului poate fi introdusă și atunci când se fac ajustări statistice pentru variabilele care se află pe calea cauzală dintre factorul de risc și rezultat. Cunoașterea A priori a structurii cauzale subiacente a variabilelor și dacă acestea funcționează ca o cauză comună sau consecință comună a factorului de risc și a rezultatului în procesul de generare a datelor poate fi greu de dedus. Prin urmare, este adecvat să se trateze părtinirea colizorului cu un nivel similar de precauție cu părtinirea confuză. Abordăm modalități de a face acest lucru mai târziu în această lucrare (“metode de detectare și minimizare a efectelor părtinirii colizorului”).

există mai multe moduri în care sunt colectate date despre COVID-19 care pot introduce condiționarea neintenționată în eșantionul selectat. Caracteristicile participanților recrutați sunt legate de o serie de factori, inclusiv deciziile politice, limitările costurilor, accesul tehnologic și metodele de testare. De asemenea, este recunoscut pe scară largă faptul că adevărata prevalență a bolii la populație rămâne necunoscută25. Aici descriem formele de colectare a datelor pentru COVID-19 înainte de a detalia circumstanțele din jurul COVID-19 care fac ca analiza sa să fie susceptibilă la prejudecăți de coliziune.

strategii de eșantionare COVID-19 și definiții de caz / control

eșantionare condiționată de participarea voluntară (definiție de caz: COVID-19 probabil, definiția controlului: participant voluntar care nu raportează simptomele COVID-19, Fig. 2a): starea probabilă a COVID-19 poate fi determinată prin studii care necesită participare voluntară. Acestea pot include, de exemplu,sondaje efectuate de studii de cohortă și longitudinale existente26, 27, legătura datelor cu înregistrările administrative disponibile în unele studii de cohortă,cum ar fi Marea Britanie Biobank28, sau programe de aplicații bazate pe telefonul mobil29, 30. Participarea la studii științifice s-a dovedit a fi puternic non-aleatorie (de ex. participanții sunt în mod disproporționat susceptibili de a fi foarte educați, conștienți de sănătate și nefumători), astfel încât voluntarii din aceste probe sunt susceptibili să difere substanțial de populația țintă31, 32,33. A se vedea caseta 2 și Fig. 3 pentru o vinietă despre modul în care un study30 a explorat părtinirea colizorului în acest context.

Fig. 3: Quantile-Quantile plot of-log10 p-valori pentru factorii care influențează testarea pentru COVID-19 în UK Biobank.
figura3

axa x reprezintă valoarea p așteptată pentru 2556 teste de ipoteză și axa y reprezintă valorile P observate. Linia roșie reprezintă relația așteptată sub ipoteza nulă a nici unei asociații.

presiunile de selecție a eșantioanelor pentru studiile COVID-19

putem stratifica strategiile de eșantionare de mai sus în trei cadre primare de eșantionare. Primul dintre aceste cadre este eșantionarea bazată pe participarea voluntară, care este inerent non-aleatorie datorită factorilor care influențează participarea. Al doilea dintre acestea este eșantionarea cadrelor folosind rezultatele testelor COVID-19. Cu câteva excepții notabile (de exemplu, refs. 3,34), testarea populației pentru COVID-19 nu se efectuează în general în probe aleatorii. Al treilea dintre aceste cadre este prelevarea de probe pe baza pacienților spitalizați, cu sau fără COVID-19. Acest lucru este din nou, în mod necesar non-aleatoriu, deoarece condițiile de admitere la spital.

caseta 3 și Fig. 3 ilustrați lățimea factorilor care pot induce presiunea de selecție a eșantionului. În timp ce unii dintre factorii care influențează procesele de eșantionare pot fi comuni în toate modurile de eșantionare enumerate mai sus, unii vor fi specifici modului. Acești factori vor diferi probabil în modul în care funcționează în contextele naționale și ale sistemului de sănătate. Aici enumerăm o serie de posibile presiuni de selecție și modul în care acestea au impact asupra diferitelor cadre de eșantionare COVID-19. De asemenea, descriem identificarea/definiția cazului și detaliem modul în care acestea pot influența inferența dacă sunt lăsate neexplorate.

severitatea simptomelor: Acest lucru va influența toate cele trei cadre majore de eșantionare, deși este cel mai simplu înțeles în contextul testării. Mai multe țări au adoptat strategia de a oferi teste în principal pacienților care prezintă simptome suficient de severe pentru a necesita îngrijiri medicale, de exemplu spitalizare, așa cum a fost cazul în Marea Britanie până la sfârșitul lunii aprilie 2020. Prin urmare, multe cazuri pozitive reale din populație vor rămâne nedetectate și vor fi mai puțin susceptibile de a face parte din eșantion dacă înscrierea depinde de starea testului. Ratele ridicate de purtători de virus asimptomatici sau cazuri cu prezentarea atipică vor agrava și mai mult această problemă.

recunoașterea simptomelor: aceasta va influența, de asemenea, toate cele trei cadre de eșantionare, deoarece intrarea în toate probele este condiționată de recunoașterea simptomelor. Legat de severitatea simptomelor, dar distinct de acestea, testarea COVID-19 va varia în funcție de recunoașterea simptomelor35. Dacă o persoană nu recunoaște simptomele corecte sau consideră că simptomele lor nu sunt severe, poate fi pur și simplu instruită să se autoizoleze și să nu primească un test COVID-19. Persoanele își vor evalua severitatea simptomelor în mod diferit; cei cu anxietate legată de sănătate pot fi mai predispuși să raporteze excesiv simptomele, în timp ce cei cu mai puține informații despre pandemie sau accesul la sfaturi de sănătate pot fi subreprezentați. Aceasta va acționa funcțional ca o rată diferențială a falsurilor negative între indivizi pe baza recunoașterii simptomelor, care ar putea fi consecventă în a da estimări ridicate ale cazurilor asimptomatice și ale transmiterii36. Schimbarea orientărilor simptomelor este probabil să agraveze această problemă,ceea ce ar putea induce relații sistematice între prezentarea simptomelor și testare35, 37. Aici, grupurile cu o conștientizare mai scăzută (de exemplu, din cauza mesajelor publice inadecvate sau a barierelor lingvistice) pot avea praguri mai mari pentru testare și, prin urmare, cei care dau rezultate pozitive vor părea să aibă un risc mai mare de rezultate severe COVID-19.

ocupație: expunerea la COVID-19 este modelată în ceea ce privește ocupația. În multe țări, lucrătorii din domeniul sănătății din prima linie sunt mult mai susceptibili de a fi testați pentru COVID-19 decât populația generală5,38 Din cauza apropierii lor de virus și a consecințelor potențiale ale transmiterii legate de infecție39. Ca atare, acestea vor fi puternic supra-reprezentate în eșantioane, în funcție de starea testului. Alți lucrători cheie pot prezenta un risc ridicat de infecție din cauza unui număr mare de contacte în raport cu lucrătorii care nu sunt cheie și, prin urmare, pot fi supra-reprezentați în eșantioane, condiționate de starea testului pozitiv sau de moartea legată de COVID. Orice factori legați de aceste ocupații (de ex. etnia, poziția socio-economică, vârsta și sănătatea de bază) vor fi, prin urmare, asociate și cu selecția eșantionului. Figura 2b ilustrează un exemplu în care factorul de risc ipotezat (fumatul) nu trebuie să influențeze cauzal selecția eșantionului (pacienții spitalizați), acesta ar putea fi pur și simplu asociat din cauza confuziei dintre factorul de risc și selecția eșantionului (fiind lucrător în domeniul sănătății).

etnie: minoritățile etnice sunt, de asemenea, mai susceptibile de a fi infectate cu COVID-1940. Rezultatele negative ale COVID-19 sunt considerabil mai grave pentru persoanele din unele minorități etnice41. Acest lucru ar putea influența asociațiile estimate în cadrul cadrelor de eșantionare bazate pe pacienții spitalizați, deoarece în multe țări, grupurile etnice minoritare sunt supra-reprezentate, deoarece inegalitățile etnice în domeniul sănătății sunt omniprezente și bine documentate. Mai mult, grupurile minoritare etnice sunt mai susceptibile de a fi lucrători cheie, care sunt mai susceptibili de a fi expuși la COVID-1942. Mediul Cultural (inclusiv rasismul sistemic) și barierele lingvistice pot afecta negativ intrarea în studii, atât pe baza testării, cât și a participării voluntare43. Grupurile minoritare etnice pot fi mai dificil de recrutat în studii, chiar și într-o anumită zonă44, și pot afecta reprezentativitatea eșantionului. Minoritățile etnice au fost mai puțin susceptibile de a raporta că au fost testate în analiza noastră a datelor Biobank din Marea Britanie, unde unul dintre cei mai puternici factori asociați cu testarea a fost prima componentă genetică principală, care este un marker pentru strămoși (caseta 3). Astfel, acest lucru s-ar putea prezenta ca mai sus, prezentarea minorităților etnice la îngrijirea medicală fiind condiționată de simptome mai severe.

fragilitate: Definită aici ca o susceptibilitate mai mare la rezultatele adverse COVID-19, fragilitatea este mai probabil să fie prezentă în anumite grupuri ale populației, cum ar fi adulții în vârstă în îngrijire pe termen lung sau facilități de viață asistată, cei cu afecțiuni medicale preexistente, grupuri obeze și fumători. Este posibil ca acești factori să prezică puternic spitalizarea. În același timp,infecția și severitatea COVID-19 au probabil o influență asupra spitalizării8,9,10, 45, ceea ce înseamnă că investigarea acestor factori în cadrul pacienților spitalizați poate induce prejudecăți de coliziune. În plus, grupurile pot fi tratate diferit în ceea ce privește raportarea cu privire la COVID-19 în diferite țări46. De exemplu, în Marea Britanie, rapoartele timpurii ale deceselor “din cauza COVID-19” ar fi putut fi combinate cu decese “în timp ce erau infectate cu COVID-19″47. Persoanele cu risc ridicat sunt mai susceptibile de a fi testate în general, dar datele demografice specifice cu risc ridicat, cum ar fi cele din centrele de îngrijire pe termen lung sau cele de asistență medicală, au fost mai puțin susceptibile de a fi eșantionate în numeroase studii46. Fragilitatea prezice, de asemenea, spitalizarea în mod diferențiat între diferite grupuri, de exemplu, o persoană mai în vârstă cu simptome COVID-19 foarte severe într-o unitate de viață asistată nu poate fi dusă la spital unde ar fi o persoană mai tânără48.

Locul de reședință și conexiunea socială: există probabil o serie de influențe mai distale sau indirecte asupra selecției eșantionului. Persoanele cu acces mai bun la serviciile de asistență medicală pot fi mai susceptibile de a fi testate decât cele cu acces mai slab. Cei din zonele cu un număr mai mare de servicii medicale sau cu un transport public mai bun pot avea acces mai ușor la serviciile de testare, în timp ce cei din zonele cu un acces mai redus la serviciile medicale pot fi mai susceptibili de a fi testați49. Persoanele care locuiesc în zone cu legături spațiale sau sociale mai puternice cu focarele existente pot fi, de asemenea, mai susceptibile de a fi testate din cauza vigilenței medicale sporite în acele zone. Rețelele de sprijin familial și comunitar sunt, de asemenea, susceptibile de a influența accesul la îngrijiri medicale, de exemplu, persoanele cu responsabilități de îngrijire și rețelele de sprijin slabe ar putea fi mai puțin capabile să solicite asistență medicală50. Conectivitatea este probabil cel mai probabil să influențeze testarea cadrelor de eșantionare, deoarece testarea este condiționată de conștientizare și acces. Cu toate acestea, poate, de asemenea, să părtinească toate cele trei cadre majore de eșantionare printr-un mecanism similar cu recunoașterea simptomelor.

accesul la Internet și implicarea tehnologică: Acest lucru va influența în primul rând recrutarea voluntară prin intermediul aplicațiilor, deși poate fi, de asemenea, asociat cu o conștientizare sporită și testarea părtinitoare prin calea de recunoaștere a simptomelor. Se știe că recrutarea eșantioanelor prin intermediul aplicațiilor internet reprezintă sub-anumite grupuri32,51. În plus, acest lucru variază în funcție de proiectarea eșantionării, în cazul în care s-a demonstrat că metodele voluntare sau “pull-in” de colectare a datelor produc eșantioane mai angajate, dar mai puțin reprezentative decât metodele bazate pe publicitate sau “push out” 33. Aceste grupuri mai implicate au probabil un acces mai mare la metodele electronice de colectare a datelor și o implicare mai mare în campaniile de social media care sunt concepute pentru a recruta participanți. Ca atare, este mai probabil ca tinerii să fie suprareprezentați în studiile de participare voluntară bazate pe aplicații29.

interes Medical și științific: studiile care recrutează eșantioane voluntare pot fi părtinitoare, deoarece sunt susceptibile să conțină o cantitate disproporționată de persoane care au un interes medical sau științific puternic. Este probabil ca acești oameni să aibă ei înșiși o mai mare conștientizare a sănătății, un comportament mai sănătos, să fie mai educați și să aibă venituri mai mari31, 52.

mulți dintre factorii care pot fi testați sau incluși în seturile de date descrise aici sunt prezentați în analiza datelor privind testele Biobank din Regatul Unit (caseta 3). Mesajul cheie este că atunci când recrutarea eșantionului nu este aleatorie, există o gamă incredibil de largă de moduri în care această non-aleatorie poate submina rezultatele studiului.

metode de detectare și minimizare a efectelor polarizării colizorului

în această secțiune, descriem metode pentru a aborda fie prejudecata colizorului, fie pentru a evalua sensibilitatea rezultatelor la polarizarea colizorului. Ca și în cazul prejudecății confuze, în general nu este posibil să se demonstreze că oricare dintre metode a depășit prejudecata colizorului. Prin urmare,analizele de sensibilitate sunt cruciale în examinarea solidității concluziilor la mecanismele de selecție plauzibile18, 19.

o tehnică simplă, descriptivă pentru a evalua probabilitatea și amploarea prejudecății colizorului indusă de selecția eșantionului este de a compara mijloacele, varianțele și distribuțiile variabilelor din eșantion cu cele din populația țintă (sau un eșantion reprezentativ al populației țintă)16. Aceasta oferă informații despre profilul persoanelor selectate în eșantion din populația țintă de interes, cum ar fi dacă acestea tind să fie mai în vârstă sau mai susceptibile de a avea comorbidități. Este deosebit de important să se raporteze aceste comparații pentru variabilele cheie din analiză, cum ar fi factorul de risc și rezultatul ipotezat, și alte variabile legate de acestea. În ceea ce privește analiza riscului de îmbolnăvire cu COVID-19, un obstacol major în calea acestui demers este că, în majoritatea cazurilor, prevalența reală a infecției în populația generală este necunoscută. Deși este încurajator dacă estimările eșantionului corespund echivalentelor lor la nivel de populație, este important să recunoaștem că acest lucru nu dovedește definitiv absența Bias-urilor de colizor53. Acest lucru se datorează faptului că factorii care influențează selecția ar putea fi nemăsurați în studiu sau factorii interacționează pentru a influența selecția și rămân nedetectați atunci când compară distribuțiile marginale.

aplicabilitatea fiecărei metode depinde în mod esențial de datele disponibile pentru neparticipanți. Aceste metode pot fi, în general, împărțite în două categorii pe baza datelor disponibile: eșantioane imbricate și non-imbricate. Un eșantion imbricat se referă la situația în care variabilele cheie sunt măsurate numai într-un subset al unui “super eșantion” altfel reprezentativ, forțând astfel analiza să fie limitată la acest sub-eșantion. Un exemplu apropiat de această definiție este subeșantionul de persoane care au primit un test COVID-19 imbricat în cohorta Biobank din Marea Britanie (deși, este clar că cohorta Biobank din Marea Britanie este ea însăși eșantionată non-aleator16). Pentru probele imbricate cercetătorii pot profita de datele disponibile în super-eșantionul reprezentativ. Un eșantion non-imbricat se referă la situația în care datele sunt disponibile numai într-un eșantion nereprezentativ. Un exemplu în acest sens sunt eșantioanele de persoane spitalizate, în care nu sunt disponibile date despre persoanele care nu sunt spitalizate. De obicei, este mai dificil să abordăm prejudecățile de coliziune în probele ne-imbricate. O analiză ghidată care ilustrează ambele tipuri de analize de sensibilitate utilizând date Biobank din Marea Britanie privind testarea COVID-19 este prezentată în nota suplimentară 1.

eșantioane imbricate: ponderarea inversă a probabilității este o abordare puternică și flexibilă pentru ajustarea prejudecății colizorului în eșantioanele imbricate54,55. Efectul cauzal al factorului de risc asupra rezultatului este estimat folosind regresia ponderată, astfel încât participanții care sunt suprareprezentați în sub-eșantion sunt ponderați în jos, iar participanții care sunt subreprezentați sunt ponderați în sus. În practică, construim aceste ponderi prin estimarea probabilității ca diferiți indivizi să fie selectați în eșantion din super-eșantionul reprezentativ pe baza covariatelor lor măsurate56. De exemplu, am putea utiliza date din eșantionul Biobank complet din Marea Britanie pentru a estima probabilitatea ca persoanele să primească un test pentru COVID-19 și să utilizeze aceste ponderi în analize care trebuie limitate la sub-eșantionul persoanelor testate (de exemplu, identificarea factorilor de risc pentru testarea pozitivă). Seaman și White oferă o imagine de ansamblu detaliată a considerațiilor și ipotezelor practice pentru ponderarea inversă a probabilității, cum ar fi specificarea corectă a “modelului de selecție a eșantionului” (un model statistic al relației dintre covariatele măsurate și selecția în eșantion, utilizat pentru a construi aceste greutăți), selecția variabilă și abordările pentru manipularea greutăților instabile (adică greutăți care sunt zero sau aproape zero).

o ipoteză suplimentară pentru ponderarea inversă a probabilității este că fiecare individ din populația țintă trebuie să aibă o probabilitate diferită de zero de a fi selectat în eșantion. Nici această presupunere, nici presupunerea că modelul de selecție a fost specificat corect, nu pot fi testate numai folosind datele observate. O abordare conceptual legate, folosind propension scor de potrivire, este uneori folosit pentru a evita index eveniment bias57,58. Există, de asemenea, analize de sensibilitate pentru specificarea greșită a ponderilor de probabilitate. De exemplu, Zhao și colab. elaborați o analiză de sensibilitate pentru gradul în care greutățile probabilității estimate diferă de greutățile neobservate adevărate59. Această abordare este deosebit de utilă atunci când putem estima ponderile probabilității, inclusiv unele, dar nu neapărat toate, dintre predictorii relevanți ai includerii eșantionului. De exemplu, am putea estima ponderile probabilității de a primi un test COVID-19 în rândul participanților la Biobank din Marea Britanie, cu toate acestea, ne lipsesc predictori cheie, cum ar fi prezentarea simptomelor și măsurile comportamentului de căutare a asistenței medicale.

eșantioane ne-imbricate: Când avem doar date despre eșantionul de studiu (de exemplu, numai date despre participanții care au fost testați pentru COVID-19), nu este posibilă estimarea directă a modelului de selecție, deoarece persoanele neselectate (netestate) sunt neobservate. În schimb, este important să se aplice analize de sensibilitate pentru a evalua plauzibilitatea că selecția eșantionului induce părtinirea colizorului.

limite și căutări de parametri: Este posibil să se deducă gradul de părtinire a colizorului, având în vedere cunoașterea dimensiunii și direcției probabile a influențelor factorului de risc și a rezultatului asupra selecției eșantionului (indiferent dacă acestea sunt directe sau prin alți factori)19,60,61. Cu toate acestea, această abordare depinde de dimensiunea și direcția corectă și de faptul că nu există alți factori care influențează selecția. Prin urmare, este important să se exploreze diferite mecanisme posibile de selecție a eșantioanelor și să se examineze impactul acestora asupra concluziilor studiului. Am creat o aplicație web simplă ghidată de aceste ipoteze pentru a permite cercetătorilor să exploreze modele simple de selecție care ar fi necesare pentru a induce o asociere observațională: http://apps.mrcieu.ac.uk/ascrtain/. În Fig. 4 folosim un raport recent al unei asociații de protecție a fumatului asupra infecției COVID-1945 pentru a explora amploarea prejudecății de coliziune care poate fi indusă datorită eșantionării selectate, sub ipoteza nulă a lipsei unui efect cauzal.

Fig. 4: Exemplu de asociații mari induse de părtinirea colizorului în ipoteza nulă a lipsei unei relații cauzale, folosind scenarii similare cu cele raportate pentru asocierea protectoare observată a fumatului la infecția cu COVID-19.
figura4

să presupunem un scenariu simplu în care expunerea ipotezată (a) și rezultatul (Y) sunt atât binare, cât și probabilitatea fiecărei influențe de a fi selectate în eșantion (eșantioane), de ex. \(P (S = 1|A,Y) = \beta _0 + \beta _a + \beta _y + \beta _{ay}\) unde \(\beta _0\) este probabilitatea de bază de a fi selectat, \(\beta _a\) este efectul lui a, \(\beta _y\) este efectul lui Y și \(\beta _{ay}\) este efectul interacțiunii dintre A și Y. mecanismul de selecție în cauză este reprezentat în Fig. 1b (fără termenul de interacțiune desenat). Acest grafic arată ce combinații ale acestor parametri ar fi necesare pentru a induce un efect de risc aparent cu magnitudine sau > 2 (Regiunea albastră) sau un efect protector aparent cu magnitudine sau < 0.5 (regiunea roșie) în ipoteza nulă a lipsei efectului cauzal61. Pentru a crea un scenariu simplificat similar cu cel din Miyara și colab. folosim o prevalență generală a populației de fumat de 0,27 și o prevalență a eșantionului de 0,05, fixând astfel \(\beta _A\) la 0,22. Deoarece prevalența COVID – 19 nu este cunoscută în populația generală, permitem eșantionului să fie supra-sau sub-reprezentativ (axa y). De asemenea, permitem efecte de interacțiune modeste. Calculând acest spațiu al parametrilor, 40% din toate combinațiile posibile conduc la o asociere artefactuală de protecție sau risc de 2 ori care operează numai prin acest model simplu de părtinire. Este important să dezvăluiți acest nivel de incertitudine atunci când publicați estimări observaționale.

mai multe alte abordări au fost, de asemenea, implementate în aplicații web online convenabile (“anexă”). De exemplu, Smith și VanderWeele au propus o analiză a sensibilității care permite cercetătorilor să-și limiteze estimările prin specificarea parametrilor de sensibilitate reprezentând puterea selecției eșantionului (în termeni de raporturi de risc relativ). Ele oferă, de asemenea, o “valoare E”, care este cea mai mică magnitudine a acestor parametri care ar explica o asociere observată62. Aronow și Lee au propus o analiză de sensibilitate pentru mediile eșantioanelor bazate pe ponderarea inversă a probabilității în eșantioane ne-imbricate în care greutățile nu pot fi estimate, dar se presupune că sunt delimitate între două valori specificate de cercetător63. Această activitate a fost generalizată la modele de regresie, permițând, de asemenea, încorporarea informațiilor externe relevante privind populația țintă (de exemplu, statistici rezumative din recensământ) 64. Aceste abordări de analiză a sensibilității permit cercetătorilor să exploreze dacă există structuri credibile de coliziune care ar putea explica asociațiile observaționale. Cu toate acestea, ele nu reprezintă un set exhaustiv de modele care ar putea da naștere la părtinire și nici nu dovedesc neapărat dacă părtinirea colizorului influențează rezultatele. Dacă factorul de risc pentru selecție este el însuși rezultatul unor cauze suplimentare în amonte, atunci este important să se ia în considerare impactul acestor efecte de selecție în amonte (adică nu numai modul în care factorul de risc influențează selecția, ci și modul în care cauzele factorului de risc și/sau cauzele rezultatului influențează selecția, de exemplu Fig. 2b). În timp ce aceste cauze din amonte pot avea în mod individual un efect mic asupra selecției, este posibil ca o mulțime de factori cu efecte individuale mici să aibă împreună un efect de selecție mare și să introducă Bias de colizor65.

analize de control Negative: dacă există factori măsurați în eșantionul selectat despre care se știe că nu au nicio influență asupra rezultatului, atunci testarea acestor factori pentru asocierea cu rezultatul din eșantionul selectat poate servi drept control negativ66,67. În virtute, asociațiile de control negativ ar trebui să fie nule și, prin urmare, sunt utile ca instrument de furnizare a dovezilor în sprijinul selecției. Dacă observăm asocieri cu magnitudini mai mari decât se aștepta,atunci acest lucru indică faptul că eșantionul este selectat atât pe controlul negativ, cât și pe rezultatul interesului68, 69.

analize de corelație: similar conceptual cu abordarea controalelor negative de mai sus, atunci când este selectat un eșantion, toate caracteristicile care au influențat selecția devin corelate în cadrul eșantionului (cu excepția cazului foarte puțin probabil că cauzele sunt perfect multiplicative). Testarea corelațiilor între factorii de risc ipotezați, în cazul în care se preconizează că nu ar trebui să existe nicio relație, poate indica prezența și amploarea selecției eșantionării și, prin urmare, probabilitatea unei distorsiuni a coliziunii care să denatureze analiza primară70.

implicații

majoritatea dovezilor științifice care informează Politica și luarea deciziilor clinice în timpul pandemiei COVID-19 au provenit din studii observaționale71. Am ilustrat modul în care aceste studii observaționale sunt deosebit de sensibile la eșantionarea non-aleatorie. Studiile clinice randomizate vor furniza dovezi experimentale pentru tratament, dar studiile experimentale ale infecției nu vor fi posibile din motive etice. Impactul prejudecății colizorului asupra inferențelor din studiile observaționale ar putea fi considerabil, nu numai pentru modelarea transmiterii bolii72,73, ci și pentru inferența cauzală7 și modelarea predicției2.

în timp ce există multe abordări care încearcă să amelioreze problema prejudecății colizorului, ele se bazează pe ipoteze nedovedite. Este dificil să se cunoască amploarea selecției eșantionului și, chiar dacă acest lucru ar fi cunoscut, nu se poate dovedi că a fost pe deplin contabilizat prin nicio metodă. Sondajele reprezentative ale populației34 sau strategiile de eșantionare care evită problemele Bias-urilor de coliziune74 sunt necesare de urgență pentru a furniza dovezi fiabile. Rezultatele din eșantioane care probabil nu sunt reprezentative pentru populația țintă ar trebui tratate cu prudență de către oamenii de știință și factorii de decizie politică.

Lasă un răspuns

Adresa ta de email nu va fi publicată.