Un análisis estadístico de señales de auscultación cervical de adultos con protección insegura de las vías respiratorias
Nuestro protocolo de recopilación de datos, pasos de procesamiento de señales y técnicas de extracción de funciones son idénticos a nuestro trabajo anterior con sujetos disfágicos no aspirantes (Dudik, JM, Kurosu, A, Coyle, JL, Sejdić, E: Los efectos de la disfagia en los sonidos de deglución y vibraciones en adultos, en revisión). Para completar, a continuación se incluye todo el proceso con cambios menores en la descripción de nuestros grupos experimentales. El protocolo para el estudio fue aprobado por la Junta de Revisión Institucional de la Universidad de Pittsburgh.
Recogida de datos
Nuestro equipo de grabación consistía en un acelerómetro triaxial y un micrófono de contacto conectado al cuello anterior del participante con cinta adhesiva de doble cara. El acelerómetro (ADXL 327, Analog Devices, Norwood, Massachusetts) se montó en una caja de plástico personalizada y se colocó sobre el cartílago cricoide como se describió anteriormente para proporcionar la mejor calidad de señal . Los ejes principales del acelerómetro se alinearon aproximadamente paralelos a la columna cervical y perpendiculares al plano coronal y se denominarán ejes superior-inferior y anterior-posterior, respectivamente. El tercer eje no se utilizó para este estudio, ya que una señal comparable no se utilizó en nuestro estudio de sujetos sanos . El sensor fue alimentado por una fuente de alimentación (modelo 1504, BK Precision, Yorba Linda, California) con una salida de 3V, y las señales resultantes fueron filtradas por paso de banda de 0,1 a 3000 Hz con amplificación diez veces (modelo P55, Grass Technologies, Warwick, Rhode Island). Las señales de voltaje para cada eje del acelerómetro fueron alimentadas en un DAQ 6210 de National Instruments y grabadas a 20 kHz por el programa LabVIEW Signal Express (National Instruments, Austin, Texas). Esta configuración ha demostrado ser eficaz para detectar la actividad de deglución en estudios previos . El micrófono (modelo C 411L, AKG, Viena, Austria) se colocó debajo del acelerómetro y ligeramente hacia el lado lateral derecho de la tráquea para evitar el contacto entre los dos sensores y evitar la obstrucción de la vista radiográfica de la vía aérea superior, pero aún así registrar eventos desde aproximadamente el mismo lugar. Esta ubicación se ha descrito anteriormente como apropiada para recoger señales sonoras de deglución . El micrófono se alimentaba con una fuente de alimentación (modelo B29L, AKG, Viena, Austria) y se ajustaba a impedancia de “línea” con un volumen de ‘9’, mientras que la señal de voltaje resultante se enviaba al DAQ mencionado anteriormente. Esta señal se dejó sin filtrar, ya que aún no se ha encontrado un límite superior para el ancho de banda de los sonidos de deglución. La señal fue muestreada por Signal Express a 20 kHz. Estos sensores se colocaron antes y se les permitió recopilar datos durante una evaluación videofluoroscópica de la deglución, por lo que también se obtuvieron imágenes de videofluoroscopia concurrentes. Las imágenes emitidas por la máquina de rayos X (Ultimax system, Toshiba, Tustin, CA) se ingresaron a una tarjeta de captura de video (AccuStream Express HD, Foresight Imaging, Chelmsford, MA) y se grabaron con el mismo programa Labview.
Un total de 76 pacientes con sospecha de disfagia que debían someterse a una evaluación videofluoroscópica de la deglución en el Centro Médico de la Universidad de Pittsburgh (Pittsburgh, Pensilvania) sirvieron como muestra. Los participantes fueron reclutados de la población general de pacientes hospitalizados y ambulatorios remitidos al servicio de Patología del Habla y el Lenguaje para la evaluación instrumental de la función de deglución orofaríngea con videofluoroscopia (VFS). Como resultado de la alta prevalencia de comorbilidades múltiples en pacientes con disfagia y la interacción de estas condiciones está causando disfagia, hubo pocos pacientes para los que un único diagnóstico de ingreso o adquirido en el hospital pudo ser identificado como la única causa de su disfagia. Entre los diagnósticos más comunes en nuestra cohorte se encuentran: ictus (17), trasplante de órganos (13 de pulmón, 3 de corazón, hígado, riñón o múltiples órganos), disfagia no especificada de otra manera (19), insuficiencia respiratoria (7), enfermedad neurológica no ictus (6), cáncer de pulmón, esófago, cabeza-cuello (3) y neumonía (8). Un total de 17 pacientes (10 hombres, 7 mujeres, edad media de 67 años) tenían un diagnóstico actual de accidente cerebrovascular, mientras que los 59 restantes (40 hombres, 19 mujeres, edad media de 61 años) tenían afecciones médicas no relacionadas con el accidente cerebrovascular. Los pacientes que tenían antecedentes de cirugía mayor de cabeza o cuello, estaban equipados con dispositivos de asistencia que obstruían el cuello anterior, como un tubo de traqueotomía, o no eran lo suficientemente competentes para dar su consentimiento informado, no se incluyeron en el estudio, pero no se excluyeron otras afecciones. Los pacientes con disfagia no se sometieron a un procedimiento estandarizado de recolección de datos, ya que el examen de videofluoroscopia es modificado rutinariamente por el examinador para adaptarse a cada paciente individual. Este método de adquisición de datos representa más de cerca el entorno clínico real. Todas las golondrinas analizadas se limitaron a aquellas hechas mientras la cabeza del participante estaba en una posición neutral. También se excluyeron las golondrinas hechas con maniobras como la golondrina con esfuerzo, la golondrina supraglótica o la maniobra de Mendelsohn. Los líquidos ingeridos durante el examen incluyeron líquido fino Varibar refrigerado (5 °C), con consistencia <5 cps, y Néctar Varibar, con consistencia ≈300 cps, (Bracco, Milan ,A) presentado como autoadministrado a partir de una taza en volúmenes cómodos seleccionados por el paciente, o administrado por el examinador en volúmenes de aproximadamente 3 ml a partir de una cuchara de 5 mL. Un total de 468 golondrinas (128 de pacientes con ictus, 340 sin) no tuvieron más que una penetración menor del bolo en la laringe, mientras que 53 golondrinas (19 de pacientes con ictus, 34 sin) tuvieron una mayor penetración o residuo. Estos grupos pueden clasificarse como con Aspiración de Penetración-puntuación de 3 o menos en el primer grupo o puntuación de 4 o mayor en el segundo, cuya importancia se explica en la siguiente sección .
Procesamiento y análisis de señales
Los datos registrados con el acelerómetro se sometieron a varios pasos de procesamiento para mejorar la calidad de la señal. Se utilizó una señal grabada desde el dispositivo cuando se presentó sin entrada en una fecha anterior para generar un modelo autorregresivo del ruido del dispositivo. Los coeficientes de este modelo se utilizaron para generar un filtro de respuesta de impulso finito que se utilizó para eliminar el ruido del dispositivo de la señal grabada. Posteriormente, los artefactos de movimiento y otros ruidos de baja frecuencia se eliminaron de la señal mediante el uso de estrías de mínimos cuadrados. Específicamente, utilizamos splines de cuarto orden con un número de nudos igual a \(\frac {\text {\textit {Nf}}_{l}}{f_{s}}\), donde N es el número de puntos de datos en la muestra, fs es la frecuencia de muestreo original de 10 kHz de nuestros datos, y f l es igual a 3,77 o 1,67 Hz para la dirección superior-inferior o anterior-posterior, respectivamente. Los valores de f l fueron calculados y optimizados en estudios previos. Finalmente, intentamos minimizar el impacto del ruido de banda ancha en la señal utilizando técnicas de eliminación de ondas. En concreto, elegimos utilizar wavelets Meyer de décimo orden con umbral suave. El valor de nuestro umbral se eligió para ser igual a \(\sigma \ sqrt {2 \ log N}\), donde N es el número de muestras en el conjunto de datos y σ, la desviación estándar estimada del ruido, se define como la mediana de los coeficientes de wavelets muestreados hacia abajo divididos por 0,6745. Aplicamos las mismas técnicas de filtrado de ABETO y eliminación de ondas a la señal del micrófono después de volver a calcular los coeficientes apropiados. No se aplicaron estrías u otras técnicas de eliminación de baja frecuencia a los sonidos de deglución porque no habíamos investigado si dichas frecuencias contenían información sonora importante.
Dos jueces, ambos patólogos del habla y el lenguaje con experiencia en investigación de disfagia y cuya confiabilidad inter e intra evaluador en las medidas utilizadas en este estudio ha sido establecida en investigaciones publicadas previamente, inspeccionaron visualmente los datos fluoroscópicos para medir dos parámetros: la duración de los segmentos de deglución y el grado de penetración o aspiración de las vías respiratorias durante los segmentos de deglución utilizando la escala de aspiración de penetración . Uno de estos jueces es un co-desarrollador de la escala de aspiración por penetración que desarrolló reglas de toma de decisiones para la selección de marcos específicos que marcan el inicio y el desplazamiento de la duración del segmento y en la clasificación del grado de protección de las vías respiratorias durante la deglución utilizando la escala de aspiración por penetración de ocho puntos. Luego entrenaron al segundo juez en los métodos de selección de estos fotogramas de video. Después del entrenamiento, ambos jueces evaluaron un conjunto de veinticinco golondrinas grabadas en video desconocidas, ninguna de las cuales fue incluida en los datos de los participantes para el presente estudio. La confiabilidad del juicio se evaluó utilizando el coeficiente de correlación intraclase. Los coeficientes de correlación intraclase intra-evaluador e inter-evaluador fueron de 0,998. Después de establecer la confiabilidad aceptable intra e interevaluador para la duración de los segmentos y las puntuaciones de penetración – aspiración, el segundo juez evaluó las puntuaciones de la escala de inicio de segmento, desplazamiento de segmento y penetración-aspiración para cada deglución descrita en el presente estudio.
Ciegos a los datos de la acelerometría, estos jueces segmentaron y etiquetaron cada golondrina individual. El inicio (inicio) de un segmento de la deglución se definió como el momento en el que el borde delantero del bolo tragado se cruzó con la sombra proyectada en la imagen de rayos X por el borde posterior de la rama de la mandíbula, mientras que el extremo (desplazamiento) fue el momento en el que el hueso hioides completó el movimiento asociado con la actividad faríngea relacionada con la deglución y regresó a su posición de reposo o preglución. Los puntos de tiempo proporcionados por este procedimiento se utilizaron para segmentar las señales vibratorias y acústicas, obteniendo así datos de deglución individuales. Cada golondrina también se clasificó en una escala ordinal de aspiración por penetración clínica estándar de 8 puntos (escala PA) y cualquier golondrina con una calificación de 3 o inferior se incluyó en nuestro análisis como una golondrina no aspirante. Las puntuaciones de 3 o menos en esta escala indican que no entró material en las vías respiratorias superiores (puntuación de 1), o penetración superficial de la laringe sin (puntuación de 2) o con (puntuación de 3) algún residuo de material ingerido restante en la laringe después de la ingestión. Este punto de corte para los puntajes seguro-inseguro, según se eligió, ya que la penetración laríngea más profunda, y especialmente la aspiración en la tráquea, representada por puntajes de escala de 4 y superiores, se ha encontrado que ocurre con una frecuencia insignificante en personas sanas, y para los fines de nuestro estudio, se consideraron golondrinas “inseguras”. Estos puntajes de AP se compararon con las señales adquiridas a través de los dispositivos de auscultación cervical .
Una vez filtradas y segmentadas las señales de auscultación, calculamos varias características diferentes para caracterizar cada golondrina. En el dominio del tiempo, investigamos la asimetría y curtosis de la señal, que se puede calcular con las fórmulas estadísticas típicas . También calculamos múltiples características teóricas de la información siguiendo el procedimiento descrito en publicaciones anteriores. Las señales se normalizaron a cero media y varianza unitaria, luego se dividieron en diez niveles igualmente espaciados, que iban de cero a nueve, que contenían todos los valores de señal registrados. Luego calculamos la característica de velocidad de entropía de las señales. Esto se encuentra restando el valor mínimo de la tasa de entropía normalizada de la señal de 1 para producir un valor que varía de cero, para una señal completamente aleatoria, a uno, para una señal completamente regular . La entropía normalizado de la tasa se calcula como
donde perc es el porcentaje de entradas únicas en la secuencia dada L . SÍ, es la entropía de Shannon de la secuencia y se calcula como
donde ρ(j) es la función de masa de probabilidad de la secuencia dada. Cuantificación de la señal original a 100 niveles discretos en lugar de diez nos permitió calcular la complejidad de Lempel-Ziv como
donde k es el número de secuencias únicas en la señal descompuesta y n es la longitud del patrón .
También investigamos varias características en el dominio de frecuencia. La frecuencia central, a veces denominada centroide espectral, se calculó simplemente tomando la transformada de Fourier de la señal y encontrando el promedio ponderado de todos los componentes de frecuencia positiva:
donde x(n) es la magnitud de un componente de frecuencia y f (n) es la frecuencia de ese componente. De manera similar, se encontró que la frecuencia de pico era el componente de frecuencia de Fourier con la mayor energía espectral. Definimos el ancho de banda de la señal como la desviación estándar de su transformada de Fourier .
Por último, caracterizamos nuestra señal en el dominio de frecuencia de tiempo. Contribuciones anteriores encontraron que las señales de deglución son hasta cierto punto no estacionarias , para lo cual la descomposición de la ondícula es más adecuada que un simple análisis de Fourier . Elegimos descomponer nuestra señal usando wavelets Meyer de décimo orden porque son continuas, tienen una función de escalado conocida y se asemejan más a las señales de deglución en el dominio del tiempo en comparación con las gaussianas u otras formas de wavelets comunes . La energía en un nivel de descomposición dado se definió como
donde x representa un vector de los coeficientes de aproximación o uno de los vectores que representan los coeficientes de detalle. | | ∗ / / denota la norma euclidiana . La energía total de la señal es simplemente la suma de la energía en cada nivel de descomposición. A partir de ahí, podríamos calcular la entropía de ondas como:
donde Er es la contribución relativa de un determinado nivel de descomposición a la energía total de la señal y se da como
Análisis estadístico
Tras el cálculo de las características relevantes se realizaron diversas comparaciones estadísticas en nuestro conjunto de datos. En primer lugar, intentamos probar la normalidad de nuestros datos con la prueba de Shapiro-Wilk, así como la igualdad de varianzas a través de la prueba de Levene para evaluar la viabilidad del uso de pruebas paramétricas. Sin embargo, después de separar los datos en función de las variables elegidas (puntuación PA, sexo del participante, presencia de accidente cerebrovascular, viscosidad en bolo), descubrimos que aproximadamente el 60% de nuestras distribuciones de características cumplían con estos supuestos. En este punto, optamos por incorporar pruebas no paramétricas para analizar nuestros datos.
Utilizamos la prueba de rango con signo de Wilcoxon para identificar diferencias con respecto a cada característica de las tres señales para las golondrinas seguras (puntuaciones PA de 1-3) e inseguras (puntuaciones PA de 4-8) y estratificadas por la consistencia del bolo ingerido. Se utilizó un valor de p ≤0,05 para determinar la significación. Este proceso se repitió para probar las diferencias entre los pacientes disfágicos con y sin accidente cerebrovascular durante las golondrinas “inseguras”. Para reflejar los resultados de nuestros estudios anteriores, realizamos otro conjunto de pruebas de suma de rangos para examinar las diferencias basadas en el sexo en las señales registradas de la población disfágica. Finalmente, se examinaron los efectos de la viscosidad en bolo en nuestros datos mediante el uso de pruebas de rango con signo de Wilcoxon. La edad de los sujetos no fue utilizada como variable, ya que trabajos previos han mostrado poco efecto significativo de la edad en las señales de auscultación cervical, incluso para grandes diferencias de edad .
Las estimaciones post hoc de nuestra potencia estadística se llevaron a cabo en el programa de software GPower . Utilizamos el método de estimación de Lehmann con una potencia objetivo de al menos 0,80. En forma matemática:
donde c es el valor crítico de la estadística de prueba y es igual a 1.64, E() y V a r() son los operadores de valor esperado y varianza, respectivamente, y Φ es la función de distribución acumulativa normal. W es la estadística de Mann-Whitney y es el número de instancias donde un punto de datos de un grupo tiene un rango más bajo que los puntos de datos en el grupo alternativo. Con pequeñas variaciones entre ellos debido a los tamaños variables de la población, encontramos que nuestras comparaciones tenían suficiente poder para diferenciar los efectos de tamaño moderado (d=0,40±0,05).