Statystyczna analiza sygnałów osłuchiwania szyjki macicy od osób dorosłych z niebezpieczną ochroną dróg oddechowych
nasz protokół zbierania danych, etapy przetwarzania sygnałów i techniki ekstrakcji cech są identyczne z naszymi poprzednimi pracami z osobami dysfagicznymi nie zasysającymi (Dudik, JM, Kurosu, a, Coyle, JL, Sejdić, E: skutki dysfagii o połykaniu dźwięków i wibracji u dorosłych, w ramach przeglądu). Dla kompletności, cały proces jest zawarty poniżej z niewielkimi zmianami w opisie naszych grup eksperymentalnych. Protokół do badania został zatwierdzony przez Institutional Review Board na Uniwersytecie w Pittsburghu.
zbieranie danych
nasz sprzęt rejestrujący składał się z trójosiowego akcelerometru i mikrofonu kontaktowego przymocowanego do przedniej szyi uczestnika taśmą dwustronną. Akcelerometr (ADXL 327, Analog Devices, Norwood, Massachusetts) został zamontowany w niestandardowej plastikowej obudowie i przymocowany do chrząstki cricoid, jak wcześniej opisano, aby zapewnić najwyższą jakość sygnału . Główne osie akcelerometru były ustawione w przybliżeniu równolegle do kręgosłupa szyjnego i prostopadle do płaszczyzny koronalnej i będą określane odpowiednio jako osie górna-dolna i przednia-tylna. Trzecia oś nie została wykorzystana do tego badania, ponieważ porównywalny sygnał nie został użyty w naszym badaniu na zdrowych osobnikach . Czujnik zasilany był zasilaczem (model 1504, BK Precision, Yorba Linda, Kalifornia) o napięciu wyjściowym 3V, a uzyskane sygnały były przefiltrowane pasmowo od 0,1 do 3000 Hz z dziesięciokrotnym wzmocnieniem (model P55, Grass Technologies, Warwick, Rhode Island). Sygnały napięciowe dla każdej osi akcelerometru były podawane do National Instruments 6210 DAQ i rejestrowane z częstotliwością 20 kHz przez program LabVIEW Signal Express (National Instruments, Austin, Texas). W poprzednich badaniach wykazano, że taka konfiguracja jest skuteczna w wykrywaniu aktywności połykania . Mikrofon (model C 411L, AKG, Wiedeń, Austria) został umieszczony pod akcelerometrem i nieco w kierunku prawej bocznej strony tchawicy, aby uniknąć kontaktu między dwoma czujnikami i zapobiec utrudnianiu radiograficznego widoku górnych dróg oddechowych, ale nadal rejestruje zdarzenia z mniej więcej tego samego miejsca. Miejsce to było wcześniej opisywane jako odpowiednie do zbierania sygnałów dźwiękowych . Mikrofon był zasilany przez zasilacz (model B29L, AKG, Wiedeń, Austria) i ustawiony na impedancję “liniową” z głośnością “9”, podczas gdy otrzymany Sygnał napięciowy był wysyłany do wspomnianego wcześniej DAQ. Sygnał ten pozostał niefiltrowany, gdyż nie znaleziono jeszcze górnej granicy pasma dźwięków połykających. Sygnał był próbkowany przez Signal Express przy częstotliwości 20 kHz. Czujniki te były wcześniej dołączane i pozwalały na zbieranie danych podczas wideofluoroskopowej oceny połykania, dzięki czemu uzyskiwano również równoczesne obrazy videofluoroskopowe. Obrazy wysyłane przez urządzenie rentgenowskie (System Ultimax, Toshiba, Tustin, CA) były wprowadzane do karty przechwytywania wideo (AccuStream Express HD, Foresight Imaging, Chelmsford, MA) i rejestrowane za pomocą tego samego programu Labview.
w sumie 76 pacjentów z podejrzeniem dysfagii, którzy mieli przejść videofluoroskopową ocenę połykania w University of Pittsburgh Medical Center (Pittsburgh, Pensylwania) służyło jako próbka. Uczestników rekrutowano z ogólnej populacji szpitalnej i ambulatoryjnej osób skierowanych do służby patologii języka mowy w celu instrumentalnej oceny funkcji połykania jamy ustnej i gardła za pomocą videofluoroskopii (VFS). W wyniku wysokiej częstości występowania wielu chorób współistniejących u pacjentów z dysfagią i interakcji tych warunków powoduje dysfagię, było niewielu pacjentów, dla których pojedyncza diagnoza przyjęcia lub szpital nabytych może być określone jako jedyna przyczyna ich dysfagia. Wśród najczęstszych diagnoz w naszej kohorcie były udar mózgu (17), przeszczep narządów (13 płuc, 3 serca, wątroby, nerek lub wielu narządów), dysfagia nie określono inaczej (19), niewydolność oddechowa (7), choroba neurologiczna bez udaru mózgu (6), rak płuc, przełyku, głowy-szyi (3) i zapalenie płuc (8). W sumie U 17 pacjentów (10 mężczyzn, 7 kobiet, średni wiek 67 lat) zdiagnozowano udar mózgu, podczas gdy u pozostałych 59 pacjentów (40 mężczyzn, 19 kobiet, średni wiek 61 lat) wystąpiły choroby niezwiązane z udarem. Pacjenci, którzy w wywiadzie przeszli poważną operację głowy lub szyi, byli wyposażeni w urządzenia wspomagające blokujące przednią szyję, takie jak rurka tracheostomijna, lub nie byli wystarczająco kompetentni, aby wyrazić świadomą zgodę, nie zostali włączeni do badania, ale nie wykluczono żadnych innych warunków. Pacjenci z dysfagią nie byli poddawani standaryzowanej procedurze zbierania danych, ponieważ badanie videofluoroskopii jest rutynowo modyfikowane przez egzaminatora, aby dopasować je do indywidualnego pacjenta. Ta metoda pozyskiwania danych dokładniej reprezentuje rzeczywiste środowisko kliniczne. Wszystkie analizowane jaskółki były ograniczone do tych wykonanych, gdy głowa uczestnika była w neutralnej pozycji głowy. Wyłączono również jaskółki wykonane za pomocą manewrów takich jak jaskółka wysiłkowa, jaskółka supraglottyczna czy manewr Mendelsohna. Płyny połknięte podczas badania obejmowały schłodzony (5 °c) cienki płyn Varibar o konsystencji <5 cps oraz nektar Varibar o konsystencji ≈300 cps (Bracco, Milan, ITA), podawany samodzielnie z kubka w wygodnych objętościach wybranych przez pacjenta lub podawany przez egzaminatora w objętości około 3 mL z łyżki o pojemności 5 mL. W sumie u 468 jaskółek (128 u pacjentów z udarem, 340 bez) przenikanie bolusa do krtani było nie większe niż nieznaczne, podczas gdy u 53 jaskółek (19 u pacjentów z udarem, 34 BEZ) przenikanie lub pozostałość były większe. Grupy te można zaklasyfikować jako posiadające aspirację penetracyjną-wynik 3 lub mniejszy w pierwszej grupie lub wynik 4 lub większy w drugiej, którego znaczenie zostało wyjaśnione w poniższej sekcji .
przetwarzanie i analiza sygnału
dane zarejestrowane za pomocą akcelerometru przeszły kilka etapów przetwarzania w celu poprawy jakości sygnału. Sygnał rejestrowany z urządzenia, gdy jest prezentowany bez wejścia w poprzednim terminie, został użyty do wygenerowania auto-regresywnego modelu szumu urządzenia. Współczynniki tego modelu zostały następnie wykorzystane do wygenerowania skończonego filtra odpowiedzi impulsowej, który został użyty do usunięcia szumu Urządzenia z zarejestrowanego sygnału. Następnie artefakty ruchu i inne szumy o niskiej częstotliwości zostały usunięte z sygnału za pomocą najmniej kwadratowych splajnów. W szczególności użyliśmy splajnów czwartego rzędu z liczbą węzłów równą \(\frac {\text {\textit {Nf}}_{L}} {f_{s}}\), gdzie N to liczba punktów danych w próbce, fs to pierwotna częstotliwość próbkowania 10 kHz naszych danych, A f l jest równa 3,77 lub 1,67 Hz dla kierunku górny-dolny lub przedni-tylny, odpowiednio. Wartości dla F l zostały obliczone i zoptymalizowane we wcześniejszych badaniach. Na koniec staraliśmy się zminimalizować wpływ szumu szerokopasmowego na sygnał, wykorzystując techniki odszumiania fal. W szczególności zdecydowaliśmy się na użycie falek Meyera dziesiątego rzędu z miękkim progiem. Wartość naszego progu została wybrana na równą \(\sigma \sqrt {2\log n}\), gdzie n jest liczbą próbek w zbiorze danych, a σ, szacowane odchylenie standardowe szumu, jest zdefiniowane jako mediana współczynników falkowych z próbkami w dół podzielonych przez 0,6745. Zastosowaliśmy te same techniki filtrowania FIR i odszumiania falek do sygnału mikrofonu po ponownym obliczeniu odpowiednich współczynników. Nie zastosowano żadnych splajnów ani innych technik usuwania niskich częstotliwości do dźwięków połykania, ponieważ nie zbadano, czy takie częstotliwości zawierają ważne informacje dźwiękowe.
dwóch sędziów, zarówno patologów języka mowy z doświadczeniem badawczym dysfagii i których wiarygodność między-i wewnątrz-rater w środkach stosowanych w tym badaniu została ustalona w wcześniej opublikowanych badaniach, wizualnie skontrolowało dane fluoroskopowe w celu zmierzenia dwóch parametrów: czas trwania segmentów połykania i zakres penetracji dróg oddechowych lub aspiracji podczas segmentów połykania przy użyciu skali aspiracji penetracji . Jeden z tych sędziów jest współtwórcą skali aspiracji penetracyjnej, który opracował zasady podejmowania decyzji dotyczące wyboru konkretnych ramek oznaczających początek i przesunięcie odcinka oraz oceny stopnia ochrony dróg oddechowych podczas połknięcia za pomocą ośmiopunktowej skali penetracyjno-aspiracyjnej. Następnie wyszkolili drugiego sędziego w metodach selekcji tych klatek wideo. Po treningu obaj sędziowie ocenili zestaw dwudziestu pięciu nieznanych dotąd nagrań wideo, z których żaden nie został uwzględniony w danych uczestników niniejszego badania. Wiarygodność oceny oceniano za pomocą współczynnika korelacji wewnątrzklasowej. Współczynniki korelacji wewnątrzraterowej i międzyraterowej wynosiły 0,998. Po ustaleniu dopuszczalnej niezawodności wewnątrz-i między-raterowej dla czasu trwania segmentu i wyników penetracji-aspiracji, drugi sędzia następnie ocenił wyniki w skali początku segmentu, przesunięcia segmentu i skali penetracji-aspiracji dla każdego jaskółki opisanego w niniejszym badaniu.
zaślepieni na podstawie danych z akcelerometrii, sędziowie ci posegmentowali i oznaczyli każdą pojedynczą jaskółkę. Początek (początek) odcinka jaskółki zdefiniowano jako czas, w którym krawędź czołowa połkniętego bolusa przecięła się z cieniem rzuconym na obraz rentgenowski przez tylną granicę Ramusa żuchwy, podczas gdy koniec (przesunięcie) był czasem, w którym kość gnykowa zakończyła ruch związany z aktywnością gardła związaną z połykaniem i powróciła do pozycji spoczynkowej lub przed połknięciem. Punkty czasowe przewidziane w tej procedurze zostały wykorzystane do segmentacji sygnałów wibracyjnych i akustycznych, uzyskując w ten sposób indywidualne dane dotyczące połknięcia. Każda jaskółka została również oceniona na standardowej 8-punktowej skali klinicznej penetracji i aspiracji (skala PA), a wszelkie jaskółki z oceną 3 lub niższą zostały uwzględnione w naszej analizie jako jaskółki nie aspiracyjne. Wyniki 3 lub niższe w tej skali wskazują, że albo żaden materiał nie przedostał się do górnych dróg oddechowych (wynik 1), albo płytka penetracja krtani bez (wynik 2) lub z (Wynik 3) resztkami połkniętego materiału pozostającymi w krtani po połknięciu. Ten punkt odcięcia dla punktów bezpiecznych i niebezpiecznych jako wybrany, ponieważ głębsza penetracja krtani, a zwłaszcza aspiracja do tchawicy, reprezentowana przez 4 i wyższe oceny w skali, występowały z znikomą częstotliwością u zdrowych osób, a do celów naszych badań zostały uznane za “niebezpieczne” jaskółki. Te wyniki PA zostały następnie porównane z sygnałami uzyskanymi przez urządzenia do osłuchiwania szyjki macicy .
po przefiltrowaniu i segmentacji sygnałów osłuchowych obliczyliśmy kilka różnych cech w celu scharakteryzowania każdej jaskółki. W dziedzinie czasu badaliśmy skośność i kurtozę sygnału, które można obliczyć za pomocą typowych formuł statystycznych . Obliczyliśmy również wiele cech informacyjno-teoretycznych, postępując zgodnie z procedurą opisaną w poprzednich publikacjach. Sygnały zostały znormalizowane do średniej zerowej i wariancji jednostkowej, a następnie podzielone na dziesięć równo rozmieszczonych poziomów, od zera do dziewięciu, które zawierały wszystkie zarejestrowane wartości sygnału. Następnie obliczyliśmy cechę entropii sygnałów. Można to znaleźć, odejmując minimalną wartość znormalizowanej entropii sygnału od 1, Aby uzyskać wartość, która waha się od zera, dla całkowicie losowego sygnału, do jednego, dla całkowicie regularnego sygnału . Znormalizowaną entropię oblicza się jako
gdzie perc to procent unikalnych wpisów w danej sekwencji L . SE jest entropią Shannona ciągu i jest obliczana jako
gdzie ρ (j) jest funkcją masy prawdopodobieństwa danego ciągu. Skwantowanie oryginalnego sygnału do 100 poziomów dyskretnych zamiast dziesięciu pozwoliło obliczyć złożoność Lempela-Ziva jako
gdzie k to liczba unikalnych sekwencji w rozkładzie sygnału, A n to długość wzorca .
zbadaliśmy również kilka funkcji w dziedzinie częstotliwości. Częstotliwość środkowa, czasami określana jako centroid widmowy, została po prostu obliczona poprzez wzięcie transformacji Fouriera sygnału i znalezienie średniej ważonej wszystkich dodatnich składowych częstotliwości:
gdzie x(n) jest wielkością składnika częstotliwości, A f (N) jest częstotliwością tego składnika. Podobnie stwierdzono, że częstotliwość szczytowa jest składową częstotliwości Fouriera o największej energii widmowej. Zdefiniowaliśmy szerokość pasma sygnału jako odchylenie standardowe jego transformacji Fouriera .
na koniec scharakteryzowaliśmy nasz sygnał w dziedzinie czasowo-częstotliwościowej. Wcześniejsze prace wykazały, że sygnały połykania są w pewnym stopniu niestacjonarne , do czego lepiej nadaje się rozkład falkowy niż prosta analiza Fouriera . Zdecydowaliśmy się na rozkładanie naszego sygnału za pomocą falek Meyera dziesiątego rzędu, ponieważ są one ciągłe , mają znaną funkcję skalowania i bardziej przypominają sygnały połykania w dziedzinie czasu w porównaniu do Gaussa lub innych typowych kształtów falek . Energia na danym poziomie rozkładu została zdefiniowana jako
gdzie x oznacza wektor współczynników aproksymacji lub jeden z wektorów reprezentujących współczynniki szczegółowości. / / ∗ / / oznacza normę euklidesową . Całkowita energia sygnału jest po prostu sumą energii na każdym poziomie rozkładu. Stąd możemy obliczyć entropię falową jako:
gdzie Er jest względnym udziałem danego poziomu rozkładu do całkowitej energii w sygnale i jest dana jako
analiza statystyczna
po obliczeniu odpowiednich cech przeprowadziliśmy różne porównania statystyczne na naszym zbiorze danych. Najpierw próbowaliśmy sprawdzić normalność naszych danych za pomocą testu Shapiro-Wilka, a także równość wariancji za pomocą testu Levene ‘ a w celu oceny żywotności testów parametrycznych. Jednak po rozdzieleniu danych na podstawie wybranych przez nas zmiennych (wynik PA, płeć uczestnika, obecność udaru, lepkość bolusa) stwierdziliśmy, że około 60% naszych rozkładów funkcji spełnia te założenia. W tym momencie zdecydowaliśmy się na włączenie testów nieparametrycznych do analizy naszych danych.
użyliśmy testu rank podpisanego przez Wilcoxona, aby zidentyfikować różnice w odniesieniu do każdej cechy wszystkich trzech sygnałów dla bezpiecznych (wyniki PA 1-3) i niebezpiecznych (wyniki PA 4-8) jaskółek i stratyfikowanych przez konsystencję przyjmowanego bolusa. Do określenia istotności zastosowano wartość p ≤0, 05. Proces ten powtórzono w celu zbadania różnic między pacjentami dysfagicznymi z udarem i bez udaru podczas “niebezpiecznych” jaskółek. Aby odzwierciedlić wyniki naszych poprzednich badań, wykonaliśmy kolejny zestaw testów sumy rang, aby zbadać różnice oparte na płci w Sygnałach rejestrowanych z populacji dysfagicznej. Na koniec zbadano wpływ lepkości w bolusie na nasze dane za pomocą testów Wilcoxon signed-rank. Wiek badanych nie był wykorzystywany jako zmienna, ponieważ poprzednie prace wykazały niewielki znaczący wpływ wieku na sygnały osłuchiwania szyjki macicy, nawet w przypadku dużych różnic wiekowych .
Post hoc szacunki naszej mocy statystycznej zostały przeprowadzone w programie GPower software . Zastosowaliśmy metodę estymacji Lehmanna z mocą docelową co najmniej 0,80. W formie matematycznej:
gdzie c jest wartością krytyczną statystyki badania i jest równa 1.64, E () I V A r () są odpowiednio operatorami wartości oczekiwanej i wariancji, a Φ jest normalną funkcją rozkładu kumulacyjnego. W jest statystyką Manna-Whitneya i jest liczbą przypadków, w których punkt danych z jednej grupy ma niższą rangę niż punkty danych w grupie alternatywnej. Przy niewielkich różnicach między nimi ze względu na zmienną wielkość populacji, odkryliśmy, że nasze porównania miały wystarczającą moc, aby odróżnić efekty o umiarkowanej wielkości (d = 0,40±0,05).