a statistical analysis of cervical auscultation signals from adults with unsafe airway protection
ons data collection protocol, signal processing steps, and feature extraction techniques are all identical to our previous work with non-aspirating dysfagic subjecten (Dudik, JM, Kurosu, A, Coyle, JL, Sejdić, E: the effects of dysfagia on swallow sounds and vibrations in volwassenen, Onder beoordeling). Voor de volledigheid is het volledige proces hieronder opgenomen met kleine wijzigingen in de beschrijving van onze experimentele groepen. Het protocol voor de studie werd goedgekeurd door de Institutional Review Board van de Universiteit van Pittsburgh.
gegevensverzameling
ons controleapparaat bestond uit een tri-axiale versnellingsmeter en een contactmicrofoon die met dubbelzijdige tape aan de voorste hals van de deelnemer was bevestigd. De accelerometer (Adxl 327, Analog Devices, Norwood, Massachusetts) werd gemonteerd in een aangepaste plastic behuizing, en bevestigd over het cricoïde kraakbeen zoals eerder beschreven om de hoogste signaalkwaliteit te bieden . De belangrijkste versnellingsmeter Assen werden ongeveer evenwijdig aan de cervicale wervelkolom en loodrecht op het coronale vlak uitgelijnd en zal worden aangeduid als de superior-inferior en anterior-posterior Assen, respectievelijk. De derde as werd niet gebruikt voor deze studie als een vergelijkbaar signaal werd niet gebruikt in onze studie van gezonde proefpersonen . De sensor werd aangedreven door een voeding (model 1504, BK Precision, Yorba Linda, Californië) met een 3V uitgang, en de resulterende signalen werden bandpass gefilterd van 0,1 tot 3000 Hz met tien keer versterking (model P55, Grass Technologies, Warwick, Rhode Island). De spanningssignalen voor elke as van de accelerometer werden beide ingevoerd in een National Instruments 6210 DAQ en geregistreerd bij 20 kHz door het LabVIEW-programma Signal Express (National Instruments, Austin, Texas). In eerdere studies is aangetoond dat deze opstelling effectief is voor het detecteren van slikactiviteit . De microfoon (model C 411L, AKG, Wenen, Oostenrijk) werd geplaatst onder de accelerometer en iets naar de rechter laterale zijde van de luchtpijp om contact tussen de twee sensoren te voorkomen en obstructie van de radiografische weergave van de bovenste luchtwegen te voorkomen, maar nog steeds gebeurtenissen van ongeveer dezelfde locatie registreren. Deze locatie is eerder beschreven geschikt te zijn voor het verzamelen slikken geluidssignalen . De microfoon werd gevoed door een voeding (model B29L, AKG, Wenen, Oostenrijk) en ingesteld op ‘line’ impedantie met een volume van ‘9’, terwijl het resulterende spanningssignaal werd verzonden naar de eerder genoemde DAQ. Dit signaal werd ongefilterd gelaten, omdat een bovengrens aan de bandbreedte van het inslikken van geluiden nog niet is gevonden. Het signaal werd gesampled door Signal Express op 20 kHz. Deze sensoren werden eerder bevestigd en mochten gegevens verzamelen tijdens een videofluoroscopisch slikonderzoek, dus werden ook gelijktijdig videofluoroscopiebeelden verkregen. De beelden van de x-ray machine (Ultimax system, Toshiba, Tustin, CA) werden ingevoerd op een video-opname kaart (AccuStream Express HD, Foresight Imaging, Chelmsford, MA) en opgenomen met hetzelfde Labview programma.
in totaal 76 patiënten met vermoede dysfagie die volgens de planning een videofluoroscopische slikevaluatie zouden ondergaan aan het University of Pittsburgh Medical Center (Pittsburgh, Pennsylvania) dienden als monster. De deelnemers werden gerekruteerd uit de Algemene intramurale en poliklinische populatie van personen die werden doorverwezen naar de Dienst voor spraakpathologie voor instrumentele beoordeling van de orofaryngeale slikfunctie met videofluoroscopie (VFS). Als gevolg van de hoge prevalentie van meervoudige comorbiditeiten bij patiënten met dysfagie en de interacties van deze aandoeningen veroorzaakt dysfagie, waren er weinig patiënten voor wie een enkele opname of ziekenhuis-verworven diagnose kon worden vastgesteld als de enige oorzaak van hun dysfagie. Tot de meest voorkomende diagnoses in onze cohort behoorden beroerte (17), orgaantransplantatie (13 Long -, 3 Hart -, Lever -, Nier-of meerdere organen), dysfagie niet anders gespecificeerd (19), respiratoir falen (7), neurologische ziekte zonder beroerte (6), longkanker, slokdarmkanker, hoofdhals (3) en pneumonie (8). In totaal hadden 17 patiënten (10 mannen, 7 Vrouwen, gemiddelde leeftijd 67) een huidige diagnose van beroerte, terwijl de overige 59 patiënten (40 mannen, 19 vrouwen, gemiddelde leeftijd 61) medische aandoeningen hadden die geen verband hielden met beroerte. Patiënten met een voorgeschiedenis van een grote hoofd-of halsoperatie, die uitgerust waren met hulpmiddelen die de voorste nek belemmerden, zoals een tracheostomiebuis, of die niet voldoende competent waren om geïnformeerde toestemming te geven, werden niet in het onderzoek opgenomen, maar andere aandoeningen werden niet uitgesloten. Patiënten met dysfagie ondergingen geen gestandaardiseerde gegevensverzamelingsprocedure, omdat het videofluoroscopieonderzoek routinematig door de examinator wordt aangepast aan de individuele patiënt. Deze methode van data-acquisitie vertegenwoordigt nauwer de werkelijke klinische omgeving. Alle geanalyseerde zwaluwen waren beperkt tot die gemaakt terwijl het hoofd van de deelnemer in een neutrale hoofdpositie was. Zwaluwen gemaakt met manoeuvres zoals de moeiteloze zwaluw, supraglottische zwaluw, of Mendelsohn manoeuvre werden ook uitgesloten. De tijdens het onderzoek ingeslikte vloeistoffen omvatten gekoelde (5 °C) Varibar dunne vloeistof, met <5 cps consistentie, en Varibar nectar, met ≈300 cps consistentie, (Bracco, Milaan, ITA) gepresenteerd als zelf toegediend uit een beker in comfortabele volumes zelf gekozen door de patiënt, of toegediend door de examinator in volumes van ongeveer 3 mL uit een 5 mL lepel. Een totaal van 468 zwaluwen (128 van patiënten met een beroerte, 340 zonder) hadden niet meer dan geringe penetratie van de bolus in het strottenhoofd, terwijl 53 zwaluwen (19 van degenen met een beroerte, 34 zonder) een grotere penetratie of residu hadden. Deze groepen kunnen worden geclassificeerd als met een penetratie aspiratie-score van 3 of minder in de eerste groep of een score van 4 of meer in de tweede, waarvan het belang wordt uitgelegd in de volgende paragraaf .
signaalverwerking en-analyse
gegevens die met de versnellingsmeter zijn geregistreerd, ondergingen verschillende verwerkingsstappen om de signaalkwaliteit te verbeteren. Een signaal dat van het apparaat is opgenomen wanneer het op een eerdere datum zonder input werd gepresenteerd, werd gebruikt om een auto-regressief model van de ruis van het apparaat te genereren. De coëfficiënten van dit model werden toen gebruikt om een eindige impulsresponsfilter te produceren die werd gebruikt om het apparaatruis van het geregistreerde signaal te verwijderen. Daarna werden bewegingsartefacten en andere laagfrequente ruis uit het signaal verwijderd door het gebruik van kleinste vierkante splines. Specifiek gebruikten we splines van de vierde orde met een aantal knopen gelijk aan \(\frac {\text {\textit {Nf}}_{l}}{f_{s}}\), waarbij N het aantal datapunten in het monster is, fs de oorspronkelijke 10 kHz bemonsteringsfrequentie van onze gegevens, en f l is gelijk aan respectievelijk 3,77 of 1,67 Hz voor de superior-inferior of anterior-posterior richting. De waarden voor f l werden berekend en geoptimaliseerd in eerdere studies. Tot slot hebben we geprobeerd de impact van breedbandruis op het signaal te minimaliseren door gebruik te maken van wavelet-ontoiseringstechnieken. In het bijzonder hebben we ervoor gekozen om tiende-orde Meyer wavelets met zachte dorsen te gebruiken. De waarde van onze drempel werd gekozen om gelijk te zijn aan \(\sigma \sqrt {2 \ log N}\), waarbij N het aantal monsters in de dataset is en σ, de geschatte standaardafwijking van de ruis, wordt gedefinieerd als de mediaan van de down-sampled wavelet coëfficiënten gedeeld door 0.6745. We hebben dezelfde FIR-filtertechnieken en wavelet-denoising toegepast op het microfoonsignaal na het opnieuw berekenen van de juiste coëfficiënten. Er werden geen splines of andere low-frequency verwijderingstechnieken toegepast op de slikgeluiden omdat we niet hadden onderzocht of dergelijke frequenties belangrijke geluidsinformatie bevatten.
twee rechters, beide spraaktaalpathologen met onderzoekservaring in dysfagie en wier inter – en intra-rater betrouwbaarheid van de in deze studie gebruikte metingen is vastgesteld in eerder gepubliceerd onderzoek, inspecteerden de fluoroscopische gegevens visueel om twee parameters te meten: de duur van de sliksegmenten en de mate van luchtwegpenetratie of aspiratie tijdens de sliksegmenten met behulp van de penetratie aspiratieschaal . Een van deze juryleden is mede-ontwikkelaar van de penetratie aspiratie schaal die besluitvormingsregels heeft ontwikkeld voor de selectie van specifieke frames markeren segmentduur begin en offset en in het beoordelen van de mate van luchtwegbescherming tijdens de zwaluw met behulp van de acht-punts penetratie-aspiratie schaal. Vervolgens trainden ze de tweede rechter in methoden voor de selectie van deze videoframes. Na de training evalueerden beide juryleden een set van 25 Onbekende video ‘ s opgenomen zwaluwen, die geen van allen in de deelnemersgegevens voor dit onderzoek waren opgenomen. De betrouwbaarheid van het oordeel werd beoordeeld met behulp van de intraclass correlatiecoëfficiënt. De intra-rater en inter-rater intraclass correlatiecoëfficiënten waren beide 0,998. Na vaststelling van aanvaardbare intra – en interraterbetrouwbaarheid voor segmentduur en penetratie-aspiratiescores, evalueerde de tweede rechter vervolgens de segmentbegin -, segment offset-en penetratie-aspiratiescores voor elke in deze studie beschreven zwaluw.
geblindeerd op de accelerometriegegevens, segmenteerden en etiketteerden deze rechters elke afzonderlijke zwaluw. Het begin (begin) van een zwaluwensegment werd gedefinieerd als het moment waarop de voorrand van de ingeslikte bolus de schaduw kruiste die op het röntgenbeeld werd geworpen door de achterste rand van de ramus van de onderkaak, terwijl het einde (offset) het moment was waarop het tongbeen de beweging voltooide die gepaard ging met slikgerelateerde faryngeale activiteit en terugkeerde naar zijn rust-of pre-slikpositie. De door deze procedure verschafte tijdstippen werden gebruikt om de trillings-en akoestische signalen te segmenteren, waardoor individuele zwaluwgegevens werden verkregen. Elke zwaluw werd ook beoordeeld op een standaard 8-punts ordinale klinische penetratie-aspiratie schaal (pa schaal) en elke zwaluw met een rating van 3 of lager werd in onze Analyse opgenomen als een niet-aspirerende zwaluw. Scores van 3 of lager op deze schaal geven aan dat er ofwel geen materiaal in de bovenste luchtwegen terecht is gekomen (score van 1), ofwel dat het strottenhoofd ondiep binnendringt zonder (score van 2) of met (score van 3) restjes ingeslikt materiaal achterblijft in het strottenhoofd na de zwaluw. Dit cutoff-punt voor safe-unsafe scores, zoals gekozen omdat diepere laryngeale penetratie, en vooral aspiratie in de luchtpijp, vertegenwoordigd door Schaal scores van 4 en hoger, met verwaarloosbare frequentie zijn gevonden bij gezonde personen, en voor de doeleinden van onze studie, werden beschouwd als ‘onveilige’ zwaluwen. Deze Pa scores werden vervolgens vergeleken met signalen verkregen via de cervicale auscultatie apparaten .
zodra de auscultatiesignalen werden gefilterd en gesegmenteerd, berekenden we verschillende kenmerken om elke zwaluw te karakteriseren. In het tijdsdomein onderzochten we de scheefheid en kurtose van het signaal, die kan worden berekend met de typische statistische formules . We hebben ook meerdere informatietheoretische kenmerken berekend door de procedure te volgen die in eerdere publicaties is beschreven. De signalen werden genormaliseerd tot nul gemiddelde en eenheid variantie, vervolgens verdeeld in tien gelijke afstand niveaus, variërend van nul tot negen, die alle opgenomen signaalwaarden bevatten. We berekenden vervolgens de entropiesnelheid functie van de signalen. Dit wordt gevonden door de minimumwaarde van de genormaliseerde entropiesnelheid van het signaal af te trekken van 1 om een waarde te produceren die varieert van nul, voor een volledig willekeurig signaal, tot één, voor een volledig regelmatig signaal . Het genormaliseerde entropiepercentage wordt berekend als
waarbij perc het percentage unieke vermeldingen in de gegeven reeks L is . SE is de Shannon entropie van de sequentie en wordt berekend als
waarbij ρ (j) de kansmassafunctie van de gegeven sequentie is. Door het oorspronkelijke signaal te kwantificeren tot 100 discrete niveaus in plaats van tien konden we de Lempel-Ziv complexiteit berekenen als
waarbij k het aantal unieke sequenties in het ontbonden signaal is en n de patroonlengte is .
we hebben ook een aantal kenmerken in het frequentiedomein onderzocht. De center frequentie, soms aangeduid als de spectrale zwaartepunt, was simpelweg berekend door de Fourier getransformeerde van het signaal en het vinden van de gewogen gemiddelde van alle positieve frequentie componenten:
waar x(n) is de omvang van een frequentie component en f(n) is de frequentie van dat onderdeel. Ook bleek de piekfrequentie de Fourier-frequentiecomponent te zijn met de grootste spectrale energie. We definieerden de bandbreedte van het signaal als de standaardafwijking van de fouriertransformatie .
ten slotte karakteriseerden we ons signaal in het tijdsfrequentiedomein. Uit eerdere bijdragen bleek dat sliksignalen tot op zekere hoogte niet-statisch zijn , waarvoor waveletdecompositie beter geschikt is dan een eenvoudige fourieranalyse . We kozen ervoor om ons signaal te ontbinden met behulp van tiende-orde Meyer wavelets omdat ze continu zijn, een bekende schaling functie hebben , en meer lijken op het slikken van signalen in het tijddomein in vergelijking met Gaussiaanse of andere gemeenschappelijke wavelet vormen . De energie in een gegeven ontledingsniveau werd gedefinieerd als
waarbij x een vector van de benaderingscoëfficiënten of een van de vectoren van de detailcoëfficiënten vertegenwoordigt. | | ∗ / / geeft de Euclidische norm aan . De totale energie van het signaal is gewoon de som van de energie op elk decompositieniveau. Van daaruit kunnen we de wavelet entropie berekenen als:
waar staat de relatieve bijdrage van een bepaalde afbraak niveau van de totale energie in het signaal en wordt gezien als
Statistische analyse
Na het berekenen van de relevante kenmerken die wij uitgevoerd van verschillende statistische vergelijkingen op onze data set. Eerst hebben we geprobeerd om de normaliteit van onze gegevens te testen met de Shapiro-Wilk-test en de gelijkheid van varianties via de Levense-test om de levensvatbaarheid van het gebruik van parametrische tests te beoordelen. Echter, na het scheiden van de gegevens op basis van onze gekozen variabelen (PA score, het geslacht van de deelnemer, aanwezigheid van beroerte, bolus viscositeit) vonden we dat ongeveer 60% van onze functie distributies voldeed aan deze veronderstellingen. Op dit punt hebben we ervoor gekozen om niet-parametrische tests op te nemen om onze gegevens te analyseren.
we gebruikten de Wilcoxon signed rank test om verschillen te identificeren met betrekking tot elk kenmerk van alle drie de signalen voor veilige (PA-scores van 1-3) en onveilige (PA-scores van 4-8) zwaluwen en gestratificeerd naar de consistentie van de ingenomen bolus. Een p-waarde van ≤0,05 werd gebruikt om de significantie te bepalen. Dit proces werd herhaald om verschillen te testen tussen dysfagische patiënten met en zonder beroerte tijdens ‘onveilige’ zwaluwen. Om de resultaten van onze vorige studies te spiegelen, voerden we een andere reeks rank sum tests uit om seksegebaseerde verschillen in de signalen van de dysfagische populatie te onderzoeken. Tenslotte werden de effecten van de bolusviscositeit op onze gegevens onderzocht door gebruik te maken van Wilcoxon signed-rank tests. De leeftijd van de proefpersonen werd niet gebruikt als een variabele, omdat eerder werk weinig significant effect van de leeftijd op cervicale auscultatie signalen heeft aangetoond, zelfs voor grote leeftijdsverschillen .
Post hoc schattingen van onze statistische macht werden uitgevoerd in het gpower software programma . We gebruikten Lehmann ‘ s methode van schatting met een doelvermogen van ten minste 0,80. In wiskundige vorm:
waarbij c de kritische waarde van de teststatistiek is en gelijk is aan 1,64, zijn E() en V A r() respectievelijk de verwachte waarde en variantieoperatoren en Φ de normale cumulatieve verdelingsfunctie. W is de Mann-Whitney-statistiek en is het aantal gevallen waarin een gegevenspunt van een groep een lagere rang heeft dan de gegevenspunten in de alternatieve groep. Met kleine variaties tussen hen als gevolg van de variabele grootte van de populatie, vonden we dat onze vergelijkingen voldoende vermogen hadden om matig grote (D=0,40±0,05) effecten te differentiëren.