Medidas compuestas de la calidad de la asistencia sanitaria: sensatas en teoría, problemáticas en la práctica | BMJ Quality & Safety

  • acreditación
  • anestesia
  • actitudes

Todos los sistemas de salud muestran variaciones en la calidad de la atención prestada, ya sea acceso a servicios de atención primaria,1 tiempo de respuesta de ambulancia,2 Tiempos de espera de accidentes & Emergencia3 o procesos y resultados del tratamiento.4-6 El monitoreo de esta variación en la calidad puede servir para múltiples propósitos: informar a los pacientes sobre dónde buscar mejor atención;7 permitir que los médicos comparen su desempeño con el de sus pares y, por lo tanto, identificar objetivos para los esfuerzos de mejora de la calidad a nivel local, y apoyar el desarrollo de políticas nacionales. Sin embargo, lo que todos estos tienen en común es la confianza en la fiabilidad de los datos para reflejar adecuadamente la calidad de la atención médica, a veces una suposición cuestionable.

En Calidad y Seguridad de BMJ, Hofstede et al8 han abordado una situación común en la que los proveedores (como hospitales, consultorios generales o equipos comunitarios) se clasifican de acuerdo con su desempeño en un indicador de calidad. Las clasificaciones se utilizan a menudo para hacer comparaciones directas de rendimiento entre proveedores y para identificar valores atípicos positivos o negativos. Sin embargo, una de las desventajas de este enfoque es que las filas de proveedores pueden ser susceptibles a fluctuaciones casuales en los indicadores. Por lo tanto, la precisión de las clasificaciones, es decir, su fiabilidad, debe evaluarse cuidadosamente al desarrollar este tipo de enfoques para informar sobre la calidad de la atención. Este es el caso en particular cuando el pago está vinculado al rendimiento9,o cuando los esfuerzos de mejora de la calidad en curso pueden verse socavados por errores de medición.

Las medidas de desempeño están impulsadas por la combinación de casos de pacientes, las diferencias en la atención prestada y la variación de la probabilidad, con su precisión para reflejar la variación de la calidad real determinada por dos componentes.10 El primero es la fiabilidad del indicador para cada proveedor de atención médica. Este componente (la “incertidumbre dentro del proveedor”) depende en gran medida del número de pacientes que reciben el tipo de atención en cuestión en cada proveedor y es probable que se vea afectado por variaciones aleatorias, especialmente en grupos de población más pequeños. El segundo componente es la variación en los indicadores entre proveedores. Esta “incertidumbre entre proveedores” se refiere a la verdadera variación de los indicadores entre proveedores, dejando a un lado la variación casual dentro de los proveedores individuales. Estas distinciones son pertinentes porque la fiabilidad del sistema de clasificación dependerá tanto de la incertidumbre entre proveedores como dentro de ellos.

Una forma de combinar estas dos fuentes de incertidumbre es medir la ‘rankabilidad’, definida como la razón de la variación entre hospitales y la suma de la variación entre hospitales y dentro de hospitales multiplicada por 100.10 Este porcentaje calculado describe el nivel de variación debido a las verdaderas diferencias hospitalarias, en contraposición al ruido aleatorio. Los valores bajos de este porcentaje implican que la variación en el rendimiento entre hospitales refleja en gran medida el azar, no las verdaderas diferencias en el rendimiento. Referirse a esta situación como de baja rankabilidad transmite la idea de que las clasificaciones de los hospitales son inestables: la variación del azar podría haber producido clasificaciones bastante diferentes. Por el contrario, los valores altos de rankability significan que la mayoría de las variaciones observadas en el rendimiento reflejan diferencias reales entre hospitales, por lo que cualquier clasificación es bastante estable.

Hofstede et al8 examinan si es posible mejorar la fiabilidad de las clasificaciones basadas en medidas de calidad. Se evalúan dos estrategias: combinar datos de indicadores a lo largo de varios años para aumentar el número de eventos (por ejemplo, reportar tasas de readmisión basadas en el número de admisiones que ocurren durante un período de varios años en lugar de un solo año) o generar una medida compuesta combinando información de dos o más indicadores de calidad. Ambos enfoques podrían mejorar la rankabilidad, pero con algunas desventajas en términos de utilidad de los indicadores de calidad, como volveremos a discutir.

Hofstede y sus colegas utilizan los datos del Registro Médico Nacional holandés de más de medio millón de pacientes tratados en 95 hospitales, que contienen indicadores de mortalidad intrahospitalaria, duración de la estancia y tasas de readmisión de 30 días a lo largo de 12 años. Los autores consideraron que una relación de rankabilidad por debajo del 50% era baja, entre el 50% y el 75% moderada y por encima del 75% alta. Los resultados del análisis muestran que ambas estrategias, la recopilación de indicadores individuales a lo largo de varios años o la combinación de varios indicadores en un solo compuesto, pueden mejorar significativamente la rankabilidad en comparación con el uso de una sola medida de resultados. Sin embargo, las medidas compuestas mostraron la mayor fiabilidad de las clasificaciones en este estudio, y los autores concluyen que las medidas compuestas proporcionan más información y clasificaciones más confiables que la combinación de varios años de indicadores individuales. Pero, por supuesto, hay otras consideraciones que ahora analizaremos.

¿Cuáles son los beneficios de utilizar medidas compuestas?

El enfoque en medidas de calidad compuestas es oportuno porque se están utilizando en muchos sistemas de salud: el Centro de Servicios de Medicare y Medicaid, por ejemplo, ha introducido calificaciones con estrellas para medir el rendimiento de los planes Medicare Advantage y los planes de la Parte D. Las calificaciones por estrellas están disponibles para cinco categorías, que cubren aspectos como la experiencia y el acceso del paciente, mientras que las calificaciones por estrellas generales para los planes de medicamentos se asignan en cuatro categorías, que cubren aspectos como la seguridad de los medicamentos.11 En Alemania, las calificaciones generales se ponen a disposición del público para los hogares de asistencia residencial y domiciliaria, cubriendo 59 y 34 criterios únicos en múltiples dimensiones de calidad, respectivamente.12 13

La razón para adoptar medidas compuestas es sencilla. A lo largo de los años, los datos administrativos recopilados se han hecho disponibles y se han complementado con registros médicos electrónicos, así como con datos específicos de enfermedades de auditorías y registros. El resultado ha sido una proliferación de medidas de resultados, lo que puede dar lugar a una sobrecarga de información. Las medidas compuestas pueden ayudar a condensar esta gran cantidad de información en un solo indicador, que es fácil de usar y promete una visión general del rendimiento.14 Las medidas compuestas proporcionan información que resume una serie de dimensiones de calidad. Esto podría ser particularmente útil para los pacientes, que tienden a dar gran importancia a varios aspectos diferentes de la calidad, es decir, quieren una atención que sea efectiva, segura, centrada en el paciente y entregada con compasión.

Limitaciones de las medidas compuestas

Los beneficios potenciales de las medidas compuestas podrían verse superados por sus limitaciones sustanciales (cuadro 1). Una revisión independiente de la Health Foundation sobre los enfoques para medir la calidad de la práctica general en Inglaterra desalentó el desarrollo y la difusión de puntuaciones compuestas.15 Un problema es que las medidas compuestas pueden carecer de la capacidad de señalar cambios en la calidad de la atención que sean lo suficientemente específicos como para ser el objetivo de los proyectos de mejora. Los esfuerzos de mejora de la calidad a menudo se dirigen a un problema específico de la prestación de cuidados y se miden a través de un conjunto de indicadores definidos con precisión. Es posible que las mejoras en relación con estos indicadores no se traduzcan en cambios en las medidas compuestas que también incluyan información en otros ámbitos de calidad.

Ver esta tabla:

  • Vista en línea
  • Vista emergente
Cuadro 1

Ventajas y desventajas de las medidas de calidad compuestas

Otro problema es que las medidas compuestas podrían recoger posibles efectos secundarios. Por ejemplo, una reducción de la mortalidad puede dar lugar a un aumento posterior de los reingresos hospitalarios, ya que una mayor proporción de pacientes que sobreviven a la estancia hospitalaria inicial habrían muerto. Si se formara una medida compuesta combinando datos sobre las tasas de mortalidad y de readmisión, los dos efectos podrían anularse. Otro posible tipo de efecto de contagio ocurre cuando las mejoras en un área de atención se producen a costa de deterioros en otros lugares, por ejemplo, debido a recursos limitados. Aunque las medidas compuestas pretenden ofrecer una visión completa y equilibrada de la calidad en varios dominios, esto solo es posible si se dispone de los datos necesarios; sin embargo, si faltan datos sobre algunos dominios, esos dominios no se reflejarán tan bien como deberían estar en la puntuación compuesta, lo que puede inducir a error.

Por supuesto, los individuos y los grupos de partes interesadas pueden diferir en su evaluación sobre la importancia relativa de las medidas constitutivas. Por ejemplo,los pacientes otorgan un gran valor a recibir atención que se brinda de manera compasiva y oportuna, 16 mientras que los médicos a veces pueden poner mayor énfasis en la administración de tratamientos efectivos. Por consiguiente,un problema fundamental en el uso de medidas compuestas es la ponderación de determinadas medidas de resultados individuales para reflejar las preferencias individuales17, y se utilizan diferentes métodos de ponderación, como la ponderación igual, numeradora y basada en la oportunidad, o la ponderación basada en el criterio de expertos.18 Es importante destacar que, para garantizar la usabilidad de las medidas compuestas, su construcción y selección de medidas de resultados debe guiarse por el propósito general de su uso y adaptarse al usuario final. Las medidas compuestas pueden inducir a error cuando no se dispone de datos sobre determinados dominios pertinentes para el usuario final. Además, podría ser difícil ajustar las medidas compuestas para los factores de confusión que pueden diferir de un indicador de calidad a otro.

Conclusión

Los médicos, los gerentes de salud y los responsables políticos dependen de información confiable para emitir juicios sobre el impacto de las iniciativas pasadas en la calidad y para guiar las mejoras futuras. Las medidas compuestas son una buena idea en teoría, ya que pueden proporcionar una manera de dar sentido al creciente número de medidas sobre diversos aspectos de la calidad de la atención. El documento complementario también encontró que una medida compuesta de mortalidad hospitalaria, readmisión de 30 días y duración prolongada de la estancia mostró mejor rankability que los indicadores individuales para algunos ejemplos médicos y quirúrgicos importantes que comúnmente se someten a medición de rendimiento. De hecho, la rankabilidad, que describe la proporción de la variación de la ejecución debida a diferencias verdaderas y no al azar, representa una consideración técnica importante para cualquier medida de la ejecución.

En la práctica, sin embargo, las medidas compuestas adolecen de limitaciones significativas debido a la falta de datos, las causas complejas y las dificultades para establecer los coeficientes de ponderación adecuados que reflejen las preferencias individuales. A menos que se aborden estas limitaciones, por ejemplo, mejorando la transparencia en torno a los objetivos y limitaciones inherentes de las medidas compuestas, o permitiendo a los usuarios adaptar los compuestos para reflejar las preferencias individuales,lo que podría ayudarse con herramientas de visualización de datos19, es probable que sus principales aplicaciones se centren en ayudar a los pacientes a decidir a dónde ir para recibir atención, en lugar de mejorar la calidad. Sería mejor aconsejar a los productores de clasificaciones de rendimiento que combinaran datos a lo largo de varios años para realizar evaluaciones de impacto. Sin embargo, en última instancia, como con cualquier evaluación, el propósito de la medición de la calidad debe determinar la selección de la medida.

    1. Irving G,
    2. Neves AL,
    3. Dambha-Miller H, et al

    . Variaciones internacionales en el tiempo de consulta del médico de atención primaria: una revisión sistemática de 67 países. Abierto de BMJ 2017; 7: e017902.doi: 10.1136 / bmjopen-2017-017902

  1. Oficina Nacional de Auditoría, 2017. Servicios de ambulancia del NHS. https://www.nao.org.uk/wp-content/uploads/2017/01/NHS-AmbulanceServices.pdf

    1. Giuntella O,
    2. Nicodemo C,
    3. Vargas-Silva C

    . The effects of immigration on NHS waiting times (en inglés). J Health Econ 2018; 58: 123-43.doi: 10.1016 / j. jhealeco.2018.02.001

    1. Friebel R,
    2. Hauck K,
    3. Aylin P, et al

    . Tendencias nacionales en tasas de readmisión de emergencia: un análisis longitudinal de datos administrativos para Inglaterra entre 2006 y 2016. Abierto de BMJ 2018; 8: e020325–10.doi: 10.1136/bmjopen-2017-020325

    1. Friebel R,
    2. Hauck K,
    3. Aylin P

    . Centralización de los servicios de accidentes cerebrovasculares agudos en Londres: evaluación de impacto utilizando dos grupos de tratamiento. Economía de la salud 2018; 27: 722-32.doi: 10.1002 / hec.3630

    1. Friebel R,
    2. Dharmarajan K,
    3. Krumholz HM, et al

    . Las reducciones en las tasas de readmisión están asociadas con mejoras modestas en los beneficios de salud reportados por los pacientes después del reemplazo de cadera y rodilla en Inglaterra. Med Care 2017; 55: 834-40.doi: 10.1097 / MLR.0000000000000779

    1. Gutacker N,
    2. Siciliani L,
    3. Moscelli G, et al

    . Elección del hospital: ¿qué tipo de calidad importa?J Health Econ 2016; 50: 230-46.doi: 10.1016 / j. jhealeco.2016.08.001

    1. Hofstede SN,
    2. Ceyisakar es decir,
    3. Lingsma HF

    . Clasificación de hospitales: ¿ganamos confiabilidad utilizando indicadores compuestos en lugar de indicadores individuales?BMJ Qual Saf 2019;28: 94-102.doi: 10.1136 / bmjq-2017-007669

    1. Friebel R,
    2. Steventon A

    . Los múltiples objetivos de la remuneración con arreglo al desempeño y el riesgo de consecuencias imprevistas. BMJ Qual Saf 2016; 25: 827-31.doi:10.1136/bmjqs-2016-005392

    1. van Dishoeck AM,
    2. Lingsma HF,
    3. Mackenbach JP, et al

    . Variación aleatoria y rankabilidad de los hospitales utilizando indicadores de resultados. BMJ Qual Saf 2011; 20: 869-74.doi: 10.1136 / bmjqs.2010.048058

  2. Centros para Servicios de Medicare & Medicaid, 2018. Clasificación por estrellas de Medicare. https://www.medicare.gov/find-a-plan/staticpages/rating/planrating-help.aspx (consultado el 25 de julio de 2018).

    1. Spitzenverband G

    , Pflegenoten. https://www.gkv-spitzenverband.de/service/versicherten_service/pflegenoten_1/pflegenotenhinweise.jsp (consultado el 9 de agosto de 2018).

    1. Rechel B,
    2. McKee M,
    3. Haas M, et al

    . Informes públicos sobre la calidad, los tiempos de espera y la experiencia de los pacientes en 11 países de ingresos altos. Política de Salud 2016; 120: 377-83.doi: 10.1016 / j.healthpol.2016.02.008

  3. Foro Nacional De La Calidad. Marco de evaluación de medidas compuestas y normas nacionales de consenso voluntario para la mortalidad y la seguridad-medidas compuestas: un informe de consenso, 2009.

    1. Dixon J,
    2. Spencelayh E,
    3. Howells Un

    . Indicadores de calidad de la atención en las prácticas generales en Inglaterra. Londres, Inglaterra, 2015.

    1. Joffe S,
    2. Manocchia M,
    3. Semanas JC, et al

    . ¿Qué valoran los pacientes en su atención hospitalaria? Una perspectiva empírica de la bioética centrada en la autonomía. J Med Ethics 2003; 29: 103-8.doi: 10.1136 / jme.29.2.103

    1. Schang L,
    2. Hynninen Y,
    3. Morton, et al

    . Desarrollo de medidas compuestas sólidas de intervalos de clasificación de la calidad de la atención médica y relaciones de dominio para Juntas de Salud Escocesas. Soc Sci Med 2016;162:59–67.doi: 10.1016 / j. socscimed.2016.06.026

    1. Shwartz M,
    2. Restuccia JD,
    3. Rosen AK

    . Medidas compuestas del desempeño de los proveedores de atención médica: una descripción de los enfoques. Milbank Q 2015; 93: 788-825.doi:10.1111/1468-0009.12165

    1. Barclay M,
    2. Dixon-Woods M,
    3. Lyratzopoulos G

    . El problema con los indicadores compuestos. BMJ Qual Saf . 2018: bmjqs-2018-007798.doi: 10.1136/bmjqs-2018-007798

    1. Montori VM,
    2. Permanyer-Miralda G,
    3. Ferreira-González I, et al

    . Validez de los criterios de valoración combinados en ensayos clínicos. BMJ 2005; 330: 594-6.doi: 10.1136 / bmj.330.7491.594

Deja una respuesta

Tu dirección de correo electrónico no será publicada.