Utvikling Og psykometrisk evaluering Av skalaer For å måle faglig tillit til manuell medisin: En Rasch measurement approach
utvikling av skalaer
dataene hentet fra ulike uformelle studentgruppeintervjuer og kritiske vurderinger av litteratur bidro til å forme innholdet og målene for selvtillit skalaer og eventuell tillit spørreskjema. Elementer og deres format ble utviklet etter nøye gjennomgang av relaterte skalaer og helseopplæringsstudier, som viste forskjellige måter å vurdere profesjonell selvtillit i utdannings – eller klinisk praktikinnstillinger . Selv om disse studiene ikke speilte målene for den nåværende forskningen, ga de viktige bevis for viktigheten av profesjonell selvtillit i helseopplæringsprogrammer. Noen elementer ble også utviklet basert på en av forfatterens omfattende erfaring i atletisk trening, kiropraktikk og fysioterapi læreplaner. De var de som fokuserte på evnen til å diskutere helserisikoatferd (kosthold, narkotikabruk og trening), anvendelse av ortopedisk bracing, støtte og taping, og demonstrere rehabiliterende prosedyrer.
følgelig ble det utviklet et foreløpig instrument med 52 elementer eller uttalelser med hovedfokus på pasientkommunikasjon og kliniske ferdigheter, og (på grunn av deres rolle i selvtillit, som ble identifisert gjennom uformelle intervjuer og kritisk gjennomgang av litteratur) et sekundært fokus på tilsyn med klinikere. En Seks-punkts Likert-stil respons format for hvert element ble benyttet. Svarkategorier ble kodet fra 1 (“ikke trygg i det hele tatt”) til 6 (“veldig trygg”). Spørsmålene reflekterte interaksjoner og erfaringer med pasienter som studentene sannsynligvis ville møte, og varierte fra å diskutere generelle helseproblemer til å utføre grunnleggende og fokuserte fysiske undersøkelsesprosedyrer. For eksempel: “Hvor trygg er du i din evne til å diskutere personlige og / eller sensitive problemer med nye pasienter?”; og ” Hvor trygg er du i din evne til å utføre grunnleggende fysiske undersøkelsesprosedyrer som blodtrykk, puls og respirasjonsfrekvens på en pasient?”Innholdsgyldighet ble vurdert av et panel av lærere og forskere tilknyttet utdanningsprogrammer og kiropraktisk klinisk utdanning internship programmer I Australia og Usa. Panelmedlemmer ble bedt om å gjennomgå skalaen og kommentere hvert element og det generelle formatet. De foreslo mindre endringer for noen få elementer, og anbefalte inkludering av en demografisk seksjon og en selvrefleksjonsseksjon som inviterte elevene til å kvalifisere sine svar.
skalaen ble delt i to deler. En del av skalaen fokuserte på pasientkommunikasjon, merket Patient Communication Confidence Scale (PCCS). Den andre delen fokuserte på kliniske ferdigheter, merket Clinical Skills Confidence Scale (CSCS). De to skalaene representerer ulike aspekter av selvtillit, som begge er viktige, og mer diagnostisk informasjon om disse to forskjellige aspektene kan oppnås ved å måle dem separat og dermed kunne se om nivåene varierer. Hvis nivåene på de to aspektene skulle være forskjellige, kunne ulike læringsstrategier være rettet mot å utvikle hvert aspekt. Det er et empirisk spørsmål om de to skalaene kan oppfattes som å representere samme konstruksjon, og for noen formål kan en enkelt poengsum være alt som kreves for å ta undervisnings-og læringsbeslutninger. Men i dette tilfellet forsøkte forskningen å få informasjon om hvert av de to aspektene, da de er essensielle og sannsynligvis vil kreve forskjellige strategier for å takle dem.
for å bistå med valideringsprosessen ble to eksisterende gyldige og pålitelige skalaer innlemmet, PERSONAL Report of Communication Apprehension (PRCA-24) og General Self-efficacy (GSE) skalaer. PRCA-24-skalaen måler følelser om å kommunisere med andre. Imidlertid ble bare en underkategori (mellommenneskelig kommunikasjon) brukt i denne studien, da de andre underkategoriene ikke vanligvis oppstår i kliniske sammenhenger. Tidligere forskning har vist innhold, kriterium og konstruktiv gyldighet AV PRCA-24 . GSE-skalaen ble lagt til for å samle data om studentens generaliserte egeneffektivitet, og for å sammenligne deres generelle egeneffektivitet og spesifikke oppgaverelaterte egeneffektivitetstiltak. Tidligere forskning viser AT GSE er en pålitelig skala med konvergent og diskriminant validitet, med alfa pålitelighetskoeffisienter som strekker seg fra .75 til .90 . DET var forventet at PCCS og CSCS ville korrelere positivt MED GSE og negativt MED PRCA-24 Mellommenneskelig kommunikasjon sub-skala; derimot, disse korrelasjoner var ikke forventet å være svært høy fordi PRCA-24 OG GSE er utformet for å vurdere konstruksjoner som er like, men ikke identisk med selvtillit. Den endelige confidence questionnaire (CQ) inneholdt følgende:
-
Generell selveffektiv Skala (GSE).
-
Personlig Rapport Av Kommunikasjon Apprehension Scale (PRCA-24), Mellommenneskelig kommunikasjon sub-skala.
-
Patient Communication Confidence Scale (PCCS), 28 elementer, 6 responskategorier, ingen omvendte elementer.
-
Clinical Skills Confidence Scale (CSCS), 27 elementer, 6 responskategorier, ingen omvendte elementer.
-
selvrefleksjon seksjon.
-
Demografisk seksjon.
PCCS-elementene dekket ni aspekter av pasientkommunikasjon som oppmuntrende atferdsendring, historieopptak, forklaring og støttende. CSCS adresserte åtte aspekter av tillit til kliniske ferdigheter som manipulerende, Røntgen og fysiske undersøkelsesprosedyrer.
Deltakere og spørreskjemaadministrasjon
Deltakerne inkluderte syv kohorter av kiropraktikkstudenter (n = 269) som deltok i praktik i tertiære institusjoner i Australia og Usa. Alle kohorter hadde sammenlignbare kliniske læreplaner som ga lignende faglige erfaringer som registrering av pasienthistorier, og overvåket vurdering og behandling av pasienter. Menneskelig etikk godkjenning og student samtykke ble innhentet. CQ ble administrert i begynnelsen av studenters kliniske praksisplasser og ble gjentatt fem måneder senere (en kohort-det var ikke mulig å teste alle kohorter på dette tidspunktet) og igjen ti måneder senere (alle kohorter). Data fra bare første og tredje gang (begynnelsen av studien og ti måneder senere) ble brukt til å undersøke gyldigheten og påliteligheten til PCCENE og CSCENE. Kombinere data på denne måten er en akseptert prosedyre gjort mulig Av Rasch-modellens egenskaper av invariante sammenligninger. Legitimiteten av prosedyren kan testes empirisk ved hjelp av differensial element funksjon (DIF).
dataanalyse
Student svar på 269 returnerte spørreskjemaer over to anledninger ble sendt til psykometrisk analyse ved hjelp av polytom Rasch modell (PRM) , Gjennom Rasch Unidimensional Målemodell programvare rumm2030 . Denne modellen ble brukt til å fastslå om de to nye skalaene hadde blitt operasjonalisert vellykket, og for å vurdere aspekter av validitet og pålitelighet av skalaene . Rasch-modellen ble valgt fordi den er den eneste målemodellen i samfunnsvitenskapene som har de ønskelige skaleringsegenskapene til invariance av sammenligninger . Modellen krever at en sammenligning mellom to personer fra en gitt klasse av personer skal være uavhengig av hvilke elementer i en gitt klasse av elementer som er valgt for sammenligningen, og sammenligningen av to elementer fra en gitt klasse av elementer bør være uavhengig av hvilke personer i en gitt klasse av personer som er valgt for å gjøre sammenligningen . For mer detaljerte forklaringer Av Rasch paradigmet og prosedyrer, se For Eksempel Andrich, Andrich and Styles, Bond Og Fox og den elektroniske håndboken FOR rumm2030-programvaren . For Mange forskere representerer Rasch-paradigmet et fremskritt på klassisk testteori . I begge teoriene er for eksempel den totale poengsummen til en person på et instrument den relevante statistikken for å representere en persons stående på variabelen eller egenskapen av interesse. De rå skårene som brukes i klassisk testteori er imidlertid ikke linearisert (De er linearisert I Rasch-måling) og bør ikke behandles som målinger.
Rasch-modellen kan brukes til å undersøke data for feil eller problemer som indikeres av manglende tilpasning av modellen . Å vise at et vares svar (data) passer til modellen, er en forkortelse for å konkludere med at varen fungerer konsekvent med de andre elementene i en skala for å karakterisere en enkelt variabel som oppsummert Av Rasch-modellen. Derfor, hvis svar på et sett med elementer i en skala passer Til Rasch-modellen, etableres de som internt konsistente-noe som er en forutsetning for å bekrefte konstruktiv validitet. Videre kan tiltak for personer da legitimt brukes i grunnleggende matematiske operasjoner (for eksempel tillegg) og dermed underkastes standard statistiske prosedyrer. To viktige egenskaper er til stede hvis data passer modellen: først, tiltak av deltakerne vil være på en lineær skala; og for det andre vil tiltakene være invariante (den relative rekkefølgen av varer og personer vil være den samme uansett hvilke elementer som brukes til å sammenligne personer, og uansett hvilke personer som brukes til å sammenligne elementer). I tillegg vil undersøkelse av differensialpunktets funksjon gi bevis på om tiltakene er invariante (i hovedsak om de representerer samme konstruksjon) på tvers av utpekte grupper som passformen er bekreftet for .
i Rasch-modellen er den relevante statistikken for enhver person ganske enkelt den totale poengsummen på tvers av elementer der poengene er suksessive heltall tildelt suksessive kategorier, som er den samme statistikken som den som brukes tradisjonelt. Noen elementer kan være dikotom, og noen kan ha mer enn to bestilte kategorier. Disse resultatene er imidlertid ikke selv lineære og bør generelt ikke behandles som målinger. Spesielt påvirkes de av gulv-og takeffekter, slik at en forskjell på en rå score på 2, si, på en del av kontinuumet av konstruksjonen ikke representerer den samme forskjellen som en score på 2 på en annen del av kontinuumet. Transformasjonen av rå score ved Hjelp Av Rasch-modellen produserer lineariserte score for hver person som kan behandles som målinger og brukes i standard statistiske analyser. Disse lineariserte poengene er kjent som steder. Mer formelt Gir Rasch-modellen målinger som er kompatible med grunnleggende eller additiv conjoint måling studert i matematisk psykologi .
Rasch-modellen er en probabilistisk modell som gir en passende modell for typiske samfunnsvitenskapelige data. For polytomous elementer ligningen tar form:
der (i) X ni , er det tilfeldig variabel av responsen av person n til elementet jeg og hvor verdien av denne variabelen er et heltall 0, 1, 2, 3, …, m, β n er plasseringen av personen på variabelen, (δ ik ), k = 1, 2, 3, …, m jeg er en vektor av tersklene av elementet jeg på som sannsynligheten for at en reaksjon i tilstøtende kategorier er identiske, og γ-ni = ∑ x = 0 m exp x β n ∑ k = 0 x δ ik er summen av numerators og sikrer at Eq. (1) summerer til 1 og er en sannsynlighetserklæring .
RUMM2030-programvaren gir et omfattende utvalg av fasiliteter for å vurdere kvaliteten på varer i en skala. Fasiliteter inkluderer flere forskjellige statistiske (chi square og log rest tester av passform) og grafiske tester av passform (Kategori Og Element Karakteristiske Kurver) mellom data og modellen, og en indeks av pålitelighet, kjent som Person Separation Index (PSI). Programmet gir også informasjon om målretting av person og elementer (om spredningen av element og person steder er like), og på element avhengigheter og muligheten for meningsfulle sub-skalaer gjennom rest element korrelasjoner, rest hovedkomponent analyse, og sub-skala analyse. I kombinasjon brukes denne informasjonen til å fastslå kvaliteten på en skala og å identifisere anomalier i dataene, noe som kan føre til en dypere forståelse av konstruksjonen eller egenskapen som måles.
som nevnt i innledningen, dataanalyse adressert tre primære mål, hvorav den første var å etablere den interne konsistens og pålitelighet av hver skala. Med andre ord, representerer settene av elementer hver en enkelt konstruksjon på dette nivået? Hvis de gjør det, er man berettiget til å legge til poeng for å oppnå en total score på hver skala og deretter bruke de totale poengene (eller deres lineariserte ekvivalenter kjent som steder) for andre statistiske tester som sammenligninger av gjennomsnittlige score blant grupper eller over tid.
det andre målet var å avgjøre om elementene i hver skala har de samme psykometriske egenskapene på tvers av ulike grupper av deltakere: Dette kalles Differensial Elementfunksjon (DIF) og det avgjør om elementene har lignende psykometriske egenskaper på tvers av ulike grupper av deltakere, det vil si om elementene har invariante egenskaper på tvers av grupper. Hvis elementer viser DIF på tvers av grupper, bør de ikke brukes til å sammenligne personytelse, med mindre enkeltpersoner er fra samme gruppe. I denne studien var interessegruppene kjønn, alder, erfaring med yrket ,opptakskvalifikasjon (tidligere grad eller ikke) og anledning til administrasjon.
det tredje målet var å gi bevis på konvergent validitet AV PCCS og CSCS ved å undersøke deres statistiske korrelasjoner med de etablerte gse og PRCA-24 skalaer som vurderer noen aspekter av tillit.
for å adressere det første målet ble ulike aspekter av skalaene undersøkt. Det første aspektet var driften av responskategoriene. Elementets terskler (kuttpunktene mellom hvert etterfølgende par kategorier som, Helt Enig og Enig) må bestilles riktig. Det andre aspektet var passformen til hvert sett med elementer Til Rasch-modellen. Hvis elementene passer til modellen, som er bevis på intern konsistens, kan de aksepteres som måling av en enkelt variabel på dette nivået. To tester av passform – en statistisk (chi-torget) og en grafisk (Elementkarakteristikkurvene, ICCs) – ble brukt til å bedømme dette. I Rasch paradigmet generelt er ingen test av passform tilstrekkelig til å ta en beslutning om passform. Et tredje aspekt var målretting av elementer og personer til hverandre: dette er etablert ved å undersøke felles distribusjon av element og person steder på samme kontinuum. Et fjerde aspekt, vareavhengigheter, ble undersøkt ved inspeksjon av restkorrelasjoner mellom elementer. Hvis elementer viser avhengighet, er ett element i hvert par overflødig og beholder begge kunstig øker påliteligheten. Slike avhengigheter kan også indikere tilstedeværelse av sub-skalaer som kan undersøkes ytterligere gjennom hovedkomponent analyse av rester. Til slutt måles påliteligheten ved Hjelp Av Person Separation Index (PSI), Som Er Rasch-ekvivalenten Til Cronbachs alfa.
for å adressere det andre målet – å fastslå om elementene opererer relativt konsekvent på tvers av ulike grupper, ble differensialelementet som fungerte på tvers av gruppene For Kjønn, Alder, Tidligere Erfaring, Opptakskvalifikasjon og Anledning undersøkt.
til Slutt, for å adressere det tredje målet om å gi ytterligere bevis på gyldighet (denne gangen konvergent validitet), ble studentpoeng på skalaene korrelert med score fra de samme studentene på to eksisterende skalaer som måler konstruksjoner relatert til, men forskjellig fra tillit, og hvis gyldighet er etablert i forskningslitteraturen, nemlig GSE og PRCA-24 (interpersonell kommunikasjon).
resultatene av disse analysene gir informasjon om gyldigheten og påliteligheten til de to skalaene. Hvis disse er tilfredsstillende, kan personstedene (de lineariserte råskårene) brukes til videre analyser som for eksempel sammenligning av middelskår (personsteder) for de ulike interessegruppene, og undersøkelse av endringer i middelsteder over tid.