Análisis de concordancia | Jiotower

Clasificaciones en una escala continua

La mayoría de las mediciones físicas se realizan en una escala numérica continua. A menudo, hay más de una técnica o instrumento para medir la cantidad en cuestión, y se plantea la cuestión de cuán estrechamente concuerdan estas técnicas (1). Si uno desea introducir un nuevo método de medición de una variable médica, primero debe evaluar su validez comprobando si está de acuerdo con un método ya establecido o con un estándar de oro.

En esta sección, presentaremos métodos estadísticos para comparar dos técnicas de medición y aplicarlos a algunos ejemplos ficticios. Suponemos que un número n de personas u objetos (tal vez 100 de ellos) se someten a mediciones con cada una de las dos técnicas, lo que produce un total de n pares de mediciones. Como primer paso, las mediciones obtenidas por las dos técnicas se trazan una contra la otra en un gráfico: se representa un punto para cada miembro de la muestra, siendo su coordenada x la medida obtenida con la primera técnica y su coordenada y la medida obtenida con la segunda técnica. Si las dos técnicas concuerdan perfectamente o casi, entonces todos los puntos trazados deben estar en o cerca de la línea diagonal x = y.

En las Figuras 1a y 1b (Ejemplos a y b) se muestran dos situaciones distintas y fácilmente comprensibles. Cualquier par de medidas que fueran exactamente iguales (Medida 1 = Medida 2) se representarían como un punto situado en la línea diagonal x = y, que se dibuja en ambos gráficos. En el Ejemplo a, las dos técnicas de medición coinciden estrechamente; en el Ejemplo b, sin embargo, la gráfica revela a la vez que la diferencia entre las Mediciones 1 y 2 varía cada vez más para valores crecientes y es mayor en general que en el Ejemplo a.

Una forma más informativa de mostrar tales relaciones es el llamado diagrama Bland-Altman, que se muestra para los dos Ejemplos en las Figuras 2a y 2b. Como antes, cada par de mediciones se representa en el plano x-y, pero de una manera diferente: El promedio de las dos mediciones se representa como la coordenada x, y la diferencia entre ellas como la coordenada y. Además, la media de todas las diferencias se representa como una línea horizontal sólida, y dos líneas horizontales adicionales (punteadas) se representan por encima y por debajo de esta línea a una distancia de 1,96 veces la desviación estándar de las diferencias. Estas dos líneas corresponden a los llamados límites de acuerdo. La línea media de todas las diferencias indica una desviación sistemática de las dos técnicas de medición para las que, en general, se puede introducir una corrección; los límites de concordancia indican el tamaño de otras desviaciones que, en general, no son corregibles. Si la cantidad que se está midiendo se distribuye normalmente, el 5% de las diferencias medidas deben estar más allá de los límites de acuerdo, es decir, más de 1,96 desviaciones estándar por encima o por debajo de la media de todas las diferencias (2). El factor 2 se usa a menudo, por simplicidad, en lugar de 1.96; este último, sin embargo, corresponde más precisamente al 97.cuantil al 5% de la distribución normal. En resumen, el diagrama Bland-Altman es una ayuda útil que permite una comparación visual de las técnicas de medición.

En la Figura 2a, el diagrama de Bland-Altman, por ejemplo, confirma que las dos técnicas de medición están en estrecha concordancia. La línea de la media de todas las diferencias está muy cerca de 0; por lo tanto, no parece haber una desviación sistemática entre los valores medidos de las dos técnicas. En este ejemplo, la desviación estándar de todas las diferencias es aproximadamente 0.05. Suponiendo que la cantidad que se está midiendo se distribuye normalmente, podemos concluir que la diferencia entre las dos mediciones será inferior a 0,1 en el 95% de los casos; esta diferencia es pequeña en relación con las cantidades medidas en sí. La distancia entre los dos límites de acuerdo (en otras palabras, el ancho de la región de acuerdo) es de 0.2 en este ejemplo.

Cuando se utilizan diagramas Bland-Altman en situaciones de la vida real para ver qué tan bien coinciden dos técnicas de medición, la pregunta de si el grado de acuerdo observado es lo suficientemente bueno solo se puede responder en relación con la aplicación particular para la que se van a usar las técnicas (es decir, “¿suficientemente bueno para qué?”). Los usuarios potenciales deben decidir qué tan cerca deben estar de acuerdo las mediciones (se indica lo contrario: qué tan estrecha debe ser la banda entre los límites de acuerdo) para que sean aceptables para fines clínicos. Tetzlaff et al. (1) por ejemplo, comparó la imagen por resonancia magnética (RM) con la espirometría para una aplicación clínica específica utilizando diagramas de Bland-Altman (entre otros métodos) y encontró que el grado de concordancia era satisfactorio.

El diagrama de Bland-Altman, por ejemplo b (Figura 2b), revela inmediatamente más de una limitación para la concordancia de las dos técnicas de medición investigadas. La diferencia media entre las dos mediciones es de nuevo cercana a cero, pero los límites de concordancia son 1,4 unidades por encima y por debajo del valor medio, p.ej., se puede esperar que el 95% de todas las diferencias medidas se encuentren en el rango de -1.4 a +1.4. El médico debe decidir si una desviación de esta magnitud es aceptable. Además, la distribución no uniforme de los puntos en este diagrama indica distorsión sistemática (sesgo sistemático).

Aun así, sin embargo, un mal acuerdo en un diagrama de Bland-Altman no debería llevarnos a rechazar prematuramente una nueva técnica de medición. En la Figura 3, se muestran otros dos casos (Ejemplos c y d) en los que las dos técnicas de medición obviamente no están de acuerdo (los puntos trazados se encuentran lejos de la línea de acuerdo), sin embargo, están relacionados funcionalmente, como muestra la curva de regresión en cada caso. La relación entre las dos técnicas es lineal en el Ejemplo c (Figura 3c), no lineal en el Ejemplo d (Figura 3d).

Diagramas de nubes de puntos para comparar dos técnicas de medición relacionadas funcionalmente; Medición 1 vs Medición 2 por Ejemplo c (arriba) y Ejemplo d (abajo)

Por lo tanto, a menudo sucede que una medición se puede predecir con precisión de la otra porque las dos están claramente relacionadas funcionalmente, a pesar de que las dos mediciones en sí mismas producen valores muy diferentes. En la Figura 3d, por ejemplo, cuando la Medición 1 produce el valor 3.0, podemos usar la curva de regresión para estimar que la Medición 2 producirá el valor 7.65. La aparente falta de acuerdo entre las dos técnicas de medición es, por lo tanto, en gran medida corregible. Habiendo “corregido” la Medición 2 de esta manera por medio de la curva de regresión, que corresponde a nuestra mejor estimación de la relación funcional entre las dos mediciones, podemos comparar la Medición corregida 2 con la Medición 1 utilizando los métodos ya descritos, por ejemplo, un nuevo diagrama de Bland—Altman. Este procedimiento se asemeja mucho a la calibración de un instrumento de medición. La determinación de la relación funcional en sí misma, es decir,, la generación de curvas de regresión de los tipos que se ven en la Figura 3, requiere una variedad de métodos estadísticos, como la regresión lineal y no lineal, que no podemos discutir aquí con más detalle.

El coeficiente de correlación de Pearson (2) entre las dos técnicas de medición a menudo se considera que demuestra una relación lineal (por lo tanto, un tipo específico de relación funcional) entre ellas. De hecho, un coeficiente con un valor absoluto alto (cerca de 1 o -1) indica tal relación. Un error común, sin embargo, es malinterpretar las implicaciones de las pruebas de significación que se aplican a los coeficientes de correlación. El hallazgo de que la correlación entre dos técnicas de medición difiere significativamente de cero no indica necesariamente que las dos técnicas estén de acuerdo. Incluso la relación más mínima y prácticamente irrelevante entre dos técnicas podría, en principio, producir un hallazgo estadísticamente significativo de este tipo. Una correlación “significativa” en realidad no contiene ninguna información sobre el tamaño del desacuerdo entre los dos tipos de medición (3, 4).

Deja una respuesta

Tu dirección de correo electrónico no será publicada.