Analiza concordanței | Jiotower
evaluări pe o scară continuă
majoritatea măsurătorilor fizice sunt pe o scară numerică continuă. Adesea, există mai multe tehnici sau instrumente pentru măsurarea cantității în cauză și se pune întrebarea cât de strâns sunt de acord aceste tehnici (1). Dacă se dorește introducerea unei noi metode de măsurare a unei variabile medicale, trebuie mai întâi să se evalueze validitatea acesteia verificând cât de bine este de acord cu o metodă deja stabilită sau cu un standard de aur.
în această secțiune, vom prezenta metode statistice pentru compararea a două tehnici de măsurare și aplicarea acestora la câteva exemple fictive. Presupunem că un anumit număr n de persoane sau obiecte (poate 100 dintre ele) sunt supuse măsurării cu fiecare dintre cele două tehnici, producând un total de n perechi de măsurători. Ca prim pas, măsurătorile obținute prin cele două tehnici sunt reprezentate unul împotriva celuilalt într-un grafic: un punct este reprezentat grafic pentru fiecare membru al eșantionului, coordonata sa x fiind măsurarea obținută prin prima tehnică și coordonata sa y măsurarea obținută prin a doua tehnică. Dacă cele două tehnici sunt de acord perfect sau aproape, atunci toate punctele reprezentate grafic ar trebui să se afle pe sau lângă linia diagonală x = y.
două situații distincte și ușor de înțeles sunt prezentate în figurile 1a și 1b (exemplele a și b). Orice pereche de măsurători care au fost exact egale (măsurarea 1 = Măsurarea 2) ar fi reprezentată ca un punct situat pe linia diagonală x = y, care este desenată pe ambele grafice. În exemplul a, cele două tehnici de măsurare sunt de acord îndeaproape; în exemplul b, totuși, graficul arată imediat că diferența dintre măsurătorile 1 și 2 variază tot mai mult pentru creșterea valorilor și este mai mare în general decât în exemplul a.
un mod mai informativ de afișare a unor astfel de relații este așa-numita diagramă Bland-Altman, prezentată pentru cele două exemple în figurile 2a și 2b. Ca și înainte, fiecare pereche de măsurători este reprezentată grafic în planul X-y, dar într-un mod diferit: media celor două măsurători este reprezentată grafic ca coordonata x, iar diferența dintre ele ca coordonata Y. În plus, media tuturor diferențelor este reprezentată grafic ca o linie orizontală solidă și două linii orizontale suplimentare (punctate) sunt reprezentate grafic deasupra și dedesubtul acestei linii la o distanță de 1,96 ori abaterea standard a diferențelor. Aceste două linii corespund așa-numitelor limite de acord. Linia mediei tuturor diferențelor indică o abatere sistematică a celor două tehnici de măsurare pentru care, în general, poate fi introdusă o corecție; limitele acordului indică dimensiunea abaterilor suplimentare care, în general, nu sunt corectabile. Dacă cantitatea măsurată este distribuită în mod normal, atunci 5% din diferențele măsurate ar trebui să depășească limitele acordului, adică mai mult de 1,96 abateri standard peste sau sub media tuturor diferențelor (2). Factorul 2 este adesea folosit, pentru simplitate, în loc de 1,96; acesta din urmă, totuși, corespunde mai precis cu 97.5% din distribuția normală. Pe scurt, diagrama Bland-Altman este un ajutor util care permite o comparație vizuală a tehnicilor de măsurare.
în figura 2a, diagrama Bland-Altman, de exemplu a, confirmă faptul că cele două tehnici de măsurare sunt în strânsă legătură. Linia medie a tuturor diferențelor este foarte apropiată de 0; astfel, se pare că nu există o abatere sistematică între valorile măsurate ale celor două tehnici. În acest exemplu, abaterea standard a tuturor diferențelor este de aproximativ 0,05. Presupunând că cantitatea măsurată este distribuită în mod normal, putem concluziona că diferența dintre cele două măsurători va fi mai mică de 0,1 în 95% din cazuri; această diferență este mică în raport cu cantitățile măsurate în sine. Distanța dintre cele două limite ale acordului (cu alte cuvinte, lățimea regiunii acordului) este de 0,2 în acest exemplu.
când diagramele Bland-Altman sunt utilizate în situații reale pentru a vedea cât de bine sunt de acord două tehnici de măsurare, întrebarea dacă gradul de acord observat este suficient de bun poate fi răspuns numai în raport cu aplicația particulară pentru care tehnicile urmează să fie utilizate (adică “suficient de bun pentru ce?”). Utilizatorii potențiali trebuie să decidă cât de strâns trebuie să fie de acord măsurătorile (altfel spus: cât de îngustă trebuie să fie banda dintre limitele acordului) pentru a fi acceptabilă în scopuri clinice. Tetzlaff și colab. (1), de exemplu, a comparat imagistica prin rezonanță magnetică (RMN) cu spirometria pentru o aplicație clinică specifică folosind diagrame Bland-Altman (printre alte metode) și a constatat că gradul de acord este satisfăcător.
diagrama Bland-Altman de exemplu b (figura 2b) relevă imediat mai multe limitări ale acordului celor două tehnici de măsurare investigate. Diferența medie dintre cele două măsurători este din nou aproape de zero, dar limitele acordului sunt cu 1,4 unități peste și sub valoarea medie, adică., se poate aștepta ca 95% din toate diferențele măsurate să se situeze în intervalul -1,4 până la +1,4. Medicul trebuie să decidă dacă o abatere de această magnitudine este acceptabilă. Mai mult, distribuția neuniformă a punctelor din această diagramă indică distorsiuni sistematice (părtinire sistematică).
chiar și așa, totuși, un acord slab într-o diagramă Bland-Altman nu ar trebui să ne determine să respingem prematur o nouă tehnică de măsurare. În Figura 3, sunt prezentate alte două cazuri (exemplele c și d) în care cele două tehnici de măsurare evident nu sunt de acord (punctele reprezentate se află departe de linia de acord), dar sunt totuși legate funcțional, așa cum arată curba de regresie în fiecare caz. Relația dintre cele două tehnici este liniară în exemplul c (figura 3c), neliniară în exemplul d (figura 3D).
diagrame de nori de puncte pentru compararea a două tehnici de măsurare legate funcțional; Măsurarea 1 vs măsurarea 2 de exemplu c (mai sus) și exemplul d (mai jos)
astfel, se întâmplă adesea ca o măsurătoare să poată fi prezisă cu exactitate de cealaltă, deoarece cele două sunt clar legate funcțional, chiar dacă cele două măsurători în sine produc valori foarte diferite. În figura 3D de exemplu, când măsurarea 1 produce valoarea 3.0, putem folosi curba de regresie pentru a estima că măsurarea 2 va produce valoarea 7.65. Lipsa aparentă de acord între cele două tehnici de măsurare este astfel în mare măsură corectabilă. După ce am “corectat” măsurarea 2 în acest fel prin intermediul curbei de regresie—care corespunde celei mai bune estimări a relației funcționale dintre cele două măsurători—putem compara măsurarea corectată 2 cu măsurarea 1 folosind metodele deja descrise, de exemplu, o nouă diagramă Bland-Altman. Această procedură seamănă foarte mult cu calibrarea unui instrument de măsurare. Determinarea relației funcționale în sine, adică., generarea curbelor de regresie ale tipurilor văzute în Figura 3, necesită o varietate de metode statistice, cum ar fi regresia liniară și neliniară, pe care nu le putem discuta aici în detaliu.
coeficientul de corelație Pearson (2) dintre cele două tehnici de măsurare este adesea considerat a demonstra o relație liniară (deci, un tip specific de relație funcțională) între ele. Într-adevăr, un coeficient cu o valoare absolută ridicată (aproape 1 sau -1) indică o astfel de relație. Cu toate acestea, o eroare obișnuită este interpretarea greșită a implicațiilor testelor de semnificație care se aplică coeficienților de corelație. O constatare conform căreia corelația dintre două tehnici de măsurare diferă semnificativ de zero nu indică neapărat că cele două tehnici sunt în acord. Chiar și cea mai mică, practic irelevantă relație dintre două tehnici ar putea, în principiu, să producă o constatare semnificativă statistic de acest tip. O corelație “semnificativă” nu conține deloc informații despre dimensiunea dezacordului dintre cele două tipuri de măsurare (3, 4).