Ontwikkeling en psychometrische evaluatie van de schalen voor het meten professional het vertrouwen in de manuele geneeskunde: een Rasch-meting aanpak

Ontwikkeling van schalen

De gegevens afkomstig uit verschillende informele groep studenten interviews en kritische beoordelingen van de literatuur bijgedragen dat de inhoud en de doelstellingen van het zelfvertrouwen schalen en uiteindelijk het vertrouwen van de vragenlijst. Items en hun formaat werden ontwikkeld na zorgvuldige herziening van gerelateerde schalen en gezondheidseducatie studies, die verschillende manieren om professioneel zelfvertrouwen in educatieve of klinische stage instellingen te beoordelen hebben aangetoond . Hoewel deze studies niet de doelstellingen van het huidige onderzoek weerspiegelen, leverden ze essentiële bewijzen met betrekking tot het belang van professioneel zelfvertrouwen in gezondheidsprogramma ‘ s. Een paar items werden ook ontwikkeld op basis van een van de auteurs uitgebreide ervaring in atletische training, chiropractie en fysiotherapie curricula. Het ging hierbij om de mogelijkheid om gezondheidsrisico ‘ s te bespreken (dieet, drugsgebruik en lichaamsbeweging), de toepassing van orthopedische bracing, supports en taping, en het demonstreren van rehabilitatieprocedures.

dienovereenkomstig werd een voorlopig instrument van 52 items of verklaringen ontwikkeld met een primaire focus op patiëntencommunicatie en klinische vaardigheden, en (vanwege hun rol in zelfvertrouwen, die werd geïdentificeerd door de informele interviews en kritische literatuurstudie) een secundaire focus op het toezicht op clinici. Voor elk item werd een Zespunts Likert-stijl responsformaat gebruikt. De responscategorieën werden gecodeerd van 1 (“helemaal niet zeker”) tot 6 (“zeer zeker”). De vragen weerspiegelden interacties en ervaringen met patiënten die studenten waarschijnlijk zouden tegenkomen, en varieerden van het bespreken van algemene gezondheidsproblemen tot het uitvoeren van fundamentele en gerichte fysieke onderzoeksprocedures. Bijvoorbeeld: “hoe zeker bent u in uw vermogen om persoonlijke en/of gevoelige kwesties met nieuwe patiënten te bespreken?”; en ” hoe zeker bent u in uw vermogen om fundamentele fysieke onderzoek procedures zoals bloeddruk, pols en ademhaling bij een patiënt uit te voeren?”Content validity werd beoordeeld door een panel van docenten en onderzoekers aangesloten bij onderwijsprogramma’ s en chiropractie klinische onderwijs stageprogramma ‘ s in Australië en de Verenigde Staten. De panelleden werd gevraagd de schaal te herzien en commentaar te leveren op elk item en op het algemene formaat. Ze stelden kleine wijzigingen voor voor een paar items, en adviseerden de opname van een demografische sectie en een zelfreflectie sectie die de studenten uitnodigde om hun reacties te kwalificeren.

de schaal werd in twee delen verdeeld. Een deel van de schaal was gericht op patiëntcommunicatie, met het label de Patiëntcommunicatievertrouwensschaal (PCC ‘ s). Het andere deel focuste op klinische vaardigheden, gelabeld de Clinical Skills Confidence Scale (CSCS). De twee schalen vertegenwoordigen verschillende aspecten van zelfvertrouwen, die beide belangrijk zijn, en meer Diagnostische informatie over deze twee verschillende aspecten kan worden verkregen door ze afzonderlijk te meten en zo te kunnen zien of niveaus verschillen. Als de niveaus op de twee aspecten zouden verschillen, zouden verschillende onderwijsstrategieën kunnen worden gericht op de ontwikkeling van elk aspect. Het is een empirische vraag of de twee schalen kunnen worden opgevat als het vertegenwoordigen van dezelfde constructie en voor sommige doeleinden een enkele score kan zijn alles wat nodig is om onderwijs en leren beslissingen te nemen. In dit geval was het onderzoek echter gericht op het verkrijgen van informatie over elk van de twee aspecten, aangezien ze elk essentieel zijn en waarschijnlijk verschillende strategieën vereisen om ze aan te pakken.

ter ondersteuning van het validatieproces werden twee bestaande geldige en betrouwbare schalen opgenomen, de Personal Report of Communication Apprehension (PRCA-24) en General Self-efficacy (GSE) schalen. De PRCA-24 schaal meet gevoelens over het communiceren met anderen. Echter, slechts één subcategorie (interpersoonlijke communicatie) werd gebruikt in deze studie, omdat de andere subcategorieën niet typisch worden aangetroffen in klinische contexten. Voorafgaand onderzoek heeft aangetoond inhoud, criterium, en Construct validiteit van de PRCA-24 . De GSE schaal werd toegevoegd om gegevens te verzamelen over de gegeneraliseerde zelfwerkzaamheid van de studenten, en om hun algemene zelfwerkzaamheid en Specifieke taakgerelateerde zelfwerkzaamheid te vergelijken. Eerder onderzoek toont aan dat de GSE is een betrouwbare schaal met convergente en discriminerende validiteit, met alpha betrouwbaarheid coëfficiënten variërend van .75 voor .90 . Er werd verwacht dat de PCC ‘s en CSC’ s positief zouden correleren met de GSE en negatief met de PRCA-24 interpersoonlijke communicatie subschaal; echter, deze correlaties werden niet verwacht om zeer hoog te zijn omdat de PRCA-24 en de GSE zijn ontworpen om constructies te beoordelen die vergelijkbaar zijn, maar niet identiek zijn aan zelfvertrouwen. De definitieve vertrouwensvragenlijst (cq) bevatte het volgende::

  1. General Self-efficacy Scale (GSE).

  2. Personal Report of Communication Apprehension Scale (PRCA-24), interpersoonlijke communicatie subschaal.

  3. Patiëntcommunicatievertrouwensschaal (PCC ‘ s), 28 items, 6 responscategorieën, geen omgekeerde items.

  4. Clinical Skills Confidence Scale (CSCS), 27 items, 6 responscategorieën, geen omgekeerde items.

  5. zelfreflectie sectie.

  6. demografische sectie.

de PCC ‘ s hadden betrekking op negen aspecten van patiëntencommunicatie, zoals het aanmoedigen van gedragsverandering, het nemen van geschiedenis, het uitleggen en het ondersteunen van patiënten. De CSCS behandelde acht aspecten van vertrouwen in klinische vaardigheden zoals manipulatieve, X-ray, en fysieke onderzoeksprocedures.

deelnemers en vragenlijst administratie

deelnemers omvatten zeven cohorten Chiropractie studenten (n = 269) ingeschreven in stages in tertiaire instellingen in Australië en de Verenigde Staten. Alle cohorten hadden vergelijkbare klinische curricula die vergelijkbare professionele ervaringen opleverden, zoals het registreren van een patiëntgeschiedenis en het onder toezicht beoordelen en behandelen van patiënten. Menselijke ethische goedkeuring en toestemming van de student werden verkregen. De CQ werd toegediend aan het begin van de klinische stages van studenten en werd vijf maanden later herhaald (één cohort—het was niet haalbaar om alle cohorten op dit moment opnieuw te testen) en opnieuw tien maanden later (alle cohorten). Gegevens van slechts de eerste en derde keer (begin van de studie en tien maanden later) werden gebruikt om de geldigheid en betrouwbaarheid van de PCC ‘s en CSC’ s te onderzoeken. Het combineren van gegevens op deze manier is een geaccepteerde procedure die mogelijk wordt gemaakt door de eigenschappen van invariante vergelijkingen van het Rasch-model. De legitimiteit van de procedure kan empirisch worden getest met behulp van differential item functioning (DIF).

Data-analyse

de antwoorden van studenten op 269 ingevulde vragenlijsten werden twee keer aan psychometrische analyse onderworpen met behulp van het polytomous Rasch model (PRM) , via de Rasch Unidimensional Measurement Model software RUMM2030 . Dit model werd gebruikt om vast te stellen of de twee nieuwe schalen met succes operationeel waren en om aspecten van de validiteit en betrouwbaarheid van de schalen te beoordelen . Het Rasch-model werd gekozen omdat het het enige meetmodel in de sociale wetenschappen is dat de gewenste schaaleigenschappen van invariantie van vergelijkingen heeft . Het model vereist dat een vergelijking tussen twee personen uit een bepaalde klasse van personen onafhankelijk moet zijn van welke items in een bepaalde klasse van items voor de vergelijking worden gekozen, en de vergelijking van twee items uit een bepaalde klasse van items moet onafhankelijk zijn van welke personen in een bepaalde klasse van personen worden gekozen om de vergelijking te maken . Voor meer gedetailleerde uitleg van het Rasch paradigma en procedures, zie bijvoorbeeld Andrich, Andrich and Styles, Bond and Fox en de online handleiding voor de rumm2030 software . Voor veel onderzoekers vertegenwoordigt het Rasch-paradigma een vooruitgang op de klassieke Testtheorie . In beide theorieën, bijvoorbeeld, is de totale score van een persoon op een instrument de relevante statistiek om de positie van een persoon op de variabele of eigenschap van belang weer te geven. De ruwe scores die in de klassieke Testtheorie worden gebruikt, zijn echter niet lineair (ze zijn lineair in Rasch-meting) en moeten niet als metingen worden behandeld.

het Rasch-model kan worden gebruikt om gegevens te onderzoeken op gebreken of problemen die worden aangegeven door een gebrek aan overeenstemming met het model . Aan te tonen dat de antwoorden (gegevens) van een item passen bij het model is een afkorting voor de conclusie dat het item consistent werkt met de andere items in een schaal om een enkele variabele te karakteriseren, zoals samengevat in het Rasch-model. Daarom, als reacties op een verzameling items in een schaal passen het Rasch-model, worden ze vastgesteld als zijnde intern consistent—wat een voorwaarde is voor het bevestigen van construct validiteit. Verder kunnen maatregelen voor personen dan rechtmatig worden gebruikt in wiskundige basisbewerkingen (zoals optellen) en dus worden onderworpen aan standaard statistische procedures. Twee belangrijke eigenschappen zijn aanwezig als de gegevens in het model passen: ten eerste zullen de maten van de deelnemers lineair zijn; en ten tweede zullen de maten invariant zijn (de relatieve volgorde van items en personen zal hetzelfde zijn, ongeacht welke items worden gebruikt om personen te vergelijken, en ongeacht welke personen worden gebruikt om items te vergelijken). Bovendien zal het onderzoek naar de werking van differentiële posten aantonen of maatregelen invariant zijn (in wezen of ze dezelfde constructie vertegenwoordigen) tussen aangewezen groepen waarvoor de fit is bevestigd .

in het Rasch-model is de relevante statistiek voor een persoon gewoon de totale score over items waarbij de scores opeenvolgende gehele getallen zijn toegewezen aan opeenvolgende categorieën, wat dezelfde statistiek is als die van oudsher wordt gebruikt. Sommige items kunnen dichotoom zijn, en sommige kunnen meer dan twee geordende categorieën hebben. Deze scores zijn echter zelf niet lineair en dienen in het algemeen niet als metingen te worden behandeld. In het bijzonder worden ze beïnvloed door vloer-en plafondeffecten, zodat een verschil van een ruwe score van 2, bijvoorbeeld, op een deel van het continuüm van de constructie niet hetzelfde verschil vertegenwoordigt als een score van 2 op een ander deel van het continuüm. De transformatie van de ruwe scores met behulp van het Rasch-model levert voor elke persoon linearised scores op die als metingen kunnen worden behandeld en in standaard statistische analyses kunnen worden gebruikt. Deze linearised scores staan bekend als locaties. Formeler, het Rasch model biedt metingen die compatibel zijn met fundamentele of additieve conjunct meting bestudeerd in de wiskundige psychologie .

het Rasch-model is een probabilistisch model dat een geschikt model biedt voor typische sociaalwetenschappelijke gegevens. Voor polytomen neemt de vergelijking de vorm aan:

Pr x ni, = x ; β n , δ ik k) = exp x β n − ∑ k = 0 x δ ik / γ ni
(1)

waar (i) X ni , is de willekeurige variabele van de reactie van de persoon n item dat ik en waar de waarde van deze variabele een geheel getal 0, 1, 2, 3, …, m, β n is de locatie van de persoon op de variabele (δ ik) k = 1, 2, 3, …, m i is een vector van de drempelwaarden van onderdeel i aan dat de waarschijnlijkheid van een reactie in aangrenzende categorieën is identiek, en γ ni = ∑ x = 0 m exp x β n − ∑ k = 0 x δ ik is de som van de tellers en zorgt ervoor dat de Eq. (1) somt op 1 en is een waarschijnlijkheidsverklaring .

de rumm2030-software biedt een uitgebreide reeks faciliteiten voor het beoordelen van de kwaliteit van items op een schaal. Faciliteiten omvatten verschillende statistische (chi vierkant en log rest testen van fit) en grafische tests van fit (categorie en Item karakteristieke curven) tussen de gegevens en het model, en een index van betrouwbaarheid, bekend als de persoon scheiding Index (PSI). Het programma biedt ook informatie over de targeting van persoon en items (of de verspreiding van item en persoon locaties zijn vergelijkbaar), en op item afhankelijkheden en de mogelijkheid van zinvolle sub-schalen door middel van resterende item correlaties, resterende hoofdcomponent analyse, en sub-schaal analyse. In combinatie wordt deze informatie gebruikt om de kwaliteit van een schaal vast te stellen en anomalieën in de gegevens te identificeren, die kunnen leiden tot een dieper begrip van de constructie of eigenschap die wordt gemeten.

zoals in de inleiding werd vermeld, was de analyse van de gegevens gericht op drie primaire doelstellingen, waarvan de eerste bestond uit het vaststellen van de interne consistentie en betrouwbaarheid van elke schaal. Met andere woorden, vertegenwoordigen de verzamelingen van items elk een enkele constructie op dit schaalniveau? Als ze dat doen, dan is men gerechtvaardigd in het toevoegen van scores om een totale score te verkrijgen op elke schaal en vervolgens met behulp van die totale scores (of hun linearised equivalenten bekend als locaties) voor andere statistische tests, zoals vergelijkingen van gemiddelde scores tussen groepen of in de tijd.

het tweede doel was te bepalen of de items van elke schaal dezelfde psychometrische eigenschappen hebben voor verschillende groepen deelnemers: dit wordt Differential Item Functioning (DIF) genoemd en het bepaalt of de items vergelijkbare psychometrische eigenschappen hebben voor verschillende groepen deelnemers, dat wil zeggen of de items invariante eigenschappen hebben voor alle groepen. Als items DIF tonen tussen groepen, moeten ze niet worden gebruikt om de prestaties van personen te vergelijken, tenzij individuen uit dezelfde groep komen. In deze studie waren de Interessegroepen geslacht, leeftijd, ervaring met het beroep, toegangskwalificatie (al dan niet een eerdere graad) en de gelegenheid van de administratie.

het derde doel was het bewijs te leveren van de convergente validiteit van de PCC ‘s en CSC’ s door hun statistische correlaties te onderzoeken met de vastgestelde GSE-en PRCA-24-schalen, die een aantal aspecten van het vertrouwen beoordelen.

om het eerste doel te bereiken, werden verschillende aspecten van de schalen onderzocht. Het eerste aspect was de werking van de responscategorieën. De itemdrempels (de cut-points tussen elk opeenvolgende paar categorieën, zoals, Strongly Agree and Agree) moeten correct worden besteld. Het tweede aspect was de pasvorm van elke set items naar het Rasch-model. Als de items in het model passen, wat een bewijs is van interne consistentie, kunnen ze worden aanvaard als het meten van een enkele variabele op dit schaalniveau. Twee tests van fit – een statistische (het chi vierkant) en een grafische (het Item karakteristieke Curves, ICCs) – werden gebruikt om dit te beoordelen. In het Rasch paradigma over het algemeen is geen enkele test van fit voldoende om een beslissing over fit te nemen. Een derde aspect was het richten van items en personen op elkaar: dit wordt vastgesteld door het onderzoeken van de gezamenlijke distributie van items en personen locaties op hetzelfde continuüm. Een vierde aspect, de afhankelijkheden van de posten, werd onderzocht aan de hand van de resterende correlaties tussen de posten. Als items afhankelijkheid tonen, dan is één item in elk paar redundant en het behoud van beide kunstmatig verhoogt de betrouwbaarheid. Dergelijke afhankelijkheden kunnen ook wijzen op de aanwezigheid van subschalen die verder kunnen worden onderzocht door de analyse van de hoofdcomponenten van reststoffen. Tot slot wordt de betrouwbaarheid gemeten met behulp van de Persoonsscheidingsindex (psi), het Rasch-equivalent van Cronbach ‘ s alpha.

om het tweede doel aan te pakken – vast te stellen of de items relatief consistent werken tussen verschillende groepen, werd een onderscheid gemaakt tussen de functies van de items naar geslacht, leeftijd, eerdere ervaring, Toegangskwalificatie en gelegenheid.Ten slotte werden de scores van studenten op de schalen gecorreleerd met de scores van dezelfde studenten op twee bestaande schalen die constructies meten die verband houden met maar verschillen van vertrouwen en waarvan de geldigheid is vastgesteld in de onderzoeksliteratuur, namelijk de GSE en PRCA-24 (interpersoonlijke communicatie).

de resultaten van deze analyses geven informatie over de validiteit en betrouwbaarheid van de twee schalen. Als deze bevredigend zijn, kunnen de persoonslocaties (de linearised raw scores) worden gebruikt voor verdere analyses, zoals bijvoorbeeld de vergelijking van gemiddelde scores (persoonslocaties) voor de verschillende groepen van belang, en het onderzoek van veranderingen in gemiddelde locaties in de tijd.

Geef een antwoord

Het e-mailadres wordt niet gepubliceerd.