Analiza zgodności | Jiotower

oceny w skali ciągłej

Większość pomiarów fizycznych odbywa się w skali ciągłej. Często istnieje więcej niż jedna technika lub przyrząd do pomiaru danej ilości i pojawia się pytanie, w jakim stopniu techniki te są ze sobą zgodne (1). Jeśli ktoś chce wprowadzić nową metodę pomiaru zmiennej medycznej, musi najpierw ocenić jej ważność, sprawdzając, jak dobrze zgadza się z już ustaloną metodą lub ze złotym standardem.

w tej sekcji przedstawimy statystyczne metody porównywania dwóch technik pomiarowych i zastosujemy je do fikcyjnych przykładów. Zakładamy, że pewna liczba N osób lub przedmiotów (być może 100 z nich) poddawanych jest pomiarom każdą z tych dwóch technik, dając w sumie N par pomiarów. W pierwszym kroku pomiary uzyskane za pomocą tych dwóch technik są wykreślane ze sobą na wykresie: jeden punkt jest wykreślany dla każdego członka próbki, jego współrzędna x oznacza pomiar otrzymany pierwszą techniką, a współrzędna y oznacza pomiar otrzymany drugą techniką. Jeśli obie techniki zgadzają się doskonale lub prawie tak, to wszystkie wykreślone punkty powinny leżeć na lub w pobliżu ukośnej linii x = y.

dwie różne i łatwo zrozumiałe sytuacje przedstawiono na rysunkach 1a i 1b (przykłady a i b). Każda para pomiarów, które były dokładnie równe (pomiar 1 = Pomiar 2), zostanie wykreślona jako punkt leżący na ukośnej linii x = y, która jest rysowana na obu wykresach. W przykładzie a obie techniki pomiarowe ściśle się ze sobą zgadzają; jednak w przykładzie b Wykres od razu pokazuje, że różnica między pomiarami 1 i 2 zmienia się coraz szerzej dla rosnących wartości i jest większa ogólnie niż w przykładzie A.

bardziej pouczającym sposobem wyświetlania takich relacji jest tak zwany diagram Blanda-Altmana, pokazany dla dwóch przykładów na fig. 2a i 2b. Tak jak poprzednio, każda para pomiarów jest wykreślana w płaszczyźnie x-y, ale w inny sposób: średnia z dwóch pomiarów jest wykreślana jako współrzędna x,a różnica między nimi jako współrzędna Y. Ponadto średnia wszystkich różnic jest wykreślana jako ciągła linia pozioma, a dwie dodatkowe (kropkowane) linie poziome są wykreślane powyżej i poniżej tej linii w odległości 1,96 razy większej od odchylenia standardowego różnic. Te dwie linie odpowiadają tzw. limitom porozumienia. Linia średnia wszystkich różnic wskazuje na systematyczne odchylenie dwóch technik pomiarowych, dla których na ogół można wprowadzić korektę; granice zgodności wskazują na wielkość dalszych odchyleń, które na ogół nie są korygowane. Jeżeli mierzona ilość jest normalnie rozłożona, wówczas 5% mierzonych różnic powinno leżeć poza granicami porozumienia, tj. więcej niż 1,96 odchylenia standardowego powyżej lub poniżej średniej wszystkich różnic (2). Czynnik 2 jest często używany, dla uproszczenia, zamiast 1,96; ten ostatni odpowiada jednak dokładniej 97.5% kwantylu rozkładu normalnego. Podsumowując, diagram Blanda-Altmana jest użyteczną pomocą, która umożliwia wizualne porównanie technik pomiarowych.

na fig.2a diagram Blanda-Altmana na przykład a potwierdza, że obie techniki pomiarowe są w ścisłej zgodności. Linia średniej wszystkich różnic jest bardzo bliska 0; w związku z tym wydaje się, że nie ma systematycznych odchyleń między zmierzonymi wartościami obu technik. W tym przykładzie odchylenie standardowe wszystkich różnic wynosi w przybliżeniu 0,05. Zakładając, że mierzona ilość jest normalnie rozłożona, możemy stwierdzić, że różnica między tymi dwoma pomiarami będzie mniejsza niż 0,1 w 95% przypadków; różnica ta jest niewielka w stosunku do samych mierzonych ilości. Odległość między dwoma granicami porozumienia (innymi słowy, szerokość regionu porozumienia) wynosi 0,2 w tym przykładzie.

gdy diagramy Bland-Altmana są używane w rzeczywistych sytuacjach, aby zobaczyć, jak dobrze zgadzają się dwie techniki pomiarowe, na pytanie, czy zaobserwowany stopień zgody jest wystarczająco dobry, można odpowiedzieć tylko w odniesieniu do konkretnego zastosowania, dla którego techniki mają być stosowane (tj.”). Potencjalni użytkownicy muszą zdecydować, jak ściśle pomiary muszą się zgadzać (zaznaczono inaczej: jak wąski musi być zakres między granicami umowy), aby był akceptowany do celów klinicznych. Tetzlaff et al. (1) na przykład porównano obrazowanie metodą rezonansu magnetycznego (MRI) ze spirometrią dla określonego zastosowania klinicznego przy użyciu diagramów Bland-Altmana (między innymi) i stwierdzono, że stopień porozumienia jest zadowalający.

diagram B (rysunek 2b) na przykład B-Altmana natychmiast ujawnia więcej niż jedno ograniczenie porozumienia dwóch badanych technik pomiarowych. Średnia różnica między tymi dwoma pomiarami jest ponownie bliska zeru, ale granice porozumienia wynoszą 1,4 jednostki powyżej i poniżej średniej wartości, tj., można oczekiwać, że 95% wszystkich mierzonych różnic mieści się w zakresie od -1,4 do +1,4. Lekarz musi zdecydować, czy odchylenie tej wielkości jest dopuszczalne. Ponadto niejednorodny rozkład punktów na tym diagramie wskazuje na zniekształcenia systematyczne (odchylenie systematyczne).

mimo to jednak słabe porozumienie w diagramie mdłego-Altmana nie powinno prowadzić do przedwczesnego odrzucenia nowej techniki pomiarowej. Na rysunku 3 pokazano dwa kolejne przypadki (przykłady c i d), w których dwie techniki pomiarowe oczywiście nie zgadzają się (punkty wykreślone leżą daleko od linii porozumienia), ale mimo to są ze sobą funkcjonalnie powiązane, jak pokazuje krzywa regresji w każdym przypadku. Zależność między tymi dwoma technikami jest liniowa w przykładzie c (rysunek 3c), nieliniowa w przykładzie d (Rysunek 3d).

diagramy chmur punktów do porównywania dwóch powiązanych funkcjonalnie technik pomiarowych; Pomiar 1 vs pomiar 2 na przykład c (powyżej) i przykład d (poniżej)

Tak więc często zdarza się, że jeden pomiar można dokładnie przewidzieć z drugiego, ponieważ oba z nich są wyraźnie powiązane funkcjonalnie, mimo że same dwa pomiary dają bardzo różne wartości. Na przykład na rysunku 3d, gdy pomiar 1 daje wartość 3,0, możemy użyć krzywej regresji do oszacowania, że pomiar 2 przyniesie wartość 7,65. Widoczny brak porozumienia między tymi dwoma technikami pomiarowymi jest więc w dużej mierze poprawny. Po “skorygowaniu” pomiaru 2 w ten sposób za pomocą krzywej regresji-która odpowiada naszemu najlepszemu oszacowaniu zależności funkcjonalnej między tymi dwoma pomiarami – możemy porównać skorygowany pomiar 2 z pomiarem 1 przy użyciu już opisanych metod, np. nowego diagramu Blanda-Altmana. Procedura ta bardzo przypomina kalibrację przyrządu pomiarowego. Określenie samej zależności funkcjonalnej, tj., generowanie krzywych regresji typów widocznych na rysunku 3, wymaga różnych metod statystycznych, takich jak regresja liniowa i nieliniowa, których nie możemy tutaj szczegółowo omówić.

współczynnik korelacji Pearsona (2) między tymi dwoma technikami pomiarowymi jest często uważany za wykazujący zależność liniową (a więc specyficzny rodzaj zależności funkcjonalnej) między nimi. Rzeczywiście, Współczynnik o wysokiej wartości bezwzględnej (blisko 1 lub -1) wskazuje taką zależność. Częstym błędem jest jednak błędna interpretacja implikacji testów istotności, które są stosowane do współczynników korelacji. Stwierdzenie, że korelacja między dwiema technikami pomiarowymi różni się znacznie od zera, niekoniecznie oznacza, że obie techniki są w dobrej zgodzie. Nawet najmniejszy, praktycznie nieistotny związek między dwiema technikami mógłby w zasadzie dać statystycznie istotne odkrycie tego typu. “Znacząca” korelacja w rzeczywistości nie zawiera żadnych informacji o wielkości rozbieżności między dwoma rodzajami pomiaru (3, 4).

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany.