mérlegek fejlesztése és pszichometriai értékelése a kézi orvoslás iránti szakmai bizalom mérésére: Rasch mérési megközelítés

mérlegek fejlesztése

a különböző informális hallgatói Csoportos interjúkból és irodalomkritikai áttekintésekből származó adatok segítettek az önbizalommérlegek és az esetleges bizalmi kérdőív tartalmának és célkitűzéseinek kialakításában. Az elemeket és azok formátumát a kapcsolódó skálák és egészségügyi oktatási tanulmányok gondos áttekintése után fejlesztették ki, amelyek különböző módszereket mutattak be a szakmai önbizalom felmérésére az oktatási vagy klinikai szakmai gyakorlatokban . Bár ezek a tanulmányok nem tükrözték a jelen kutatás céljait, létfontosságú bizonyítékokat szolgáltattak a szakmai önbizalom fontosságáról az egészségügyi oktatási programokban. Néhány elemet a szerzők széles körű tapasztalata alapján fejlesztettek ki az atlétikai edzésben, a kiropraktikában és a fizikoterápiás tantervekben. Ők voltak azok, akik az egészségügyi kockázati magatartások (étrend, kábítószer-használat és testmozgás) megvitatására, az ortopédiai merevítés alkalmazására, a támaszokra és a szalagra, valamint a rehabilitációs eljárások bemutatására összpontosítottak.

ennek megfelelően egy 52 tételből vagy Nyilatkozatból álló előzetes eszközt fejlesztettek ki, amelynek elsődleges célja a betegek kommunikációja és a klinikai készségek, valamint (az önbizalomban betöltött szerepük miatt, amelyet az informális interjúk és az irodalom kritikai áttekintése során azonosítottak) másodlagos hangsúly a klinikusok felügyeletére. Minden elemhez hatpontos Likert stílusú válaszformátumot használtunk. A válaszkategóriákat 1-től (“egyáltalán nem magabiztos”) 6-ig (“nagyon magabiztos”) kódolták. A kérdések tükrözték a betegekkel való interakciókat és tapasztalatokat, amelyekkel a hallgatók valószínűleg találkoztak, és az általános egészségügyi kérdések megvitatásától az alapvető és koncentrált fizikai vizsgálati eljárások elvégzéséig terjedtek. Például: “mennyire biztos abban, hogy képes-e személyes és/vagy érzékeny kérdéseket megvitatni az új betegekkel?”; és ” mennyire biztos abban, hogy képes-e elvégezni az alapvető fizikai vizsgálati eljárásokat, például a vérnyomást, a pulzust és a légzési sebességet a betegen?”A tartalom érvényességét egy oktatókból és kutatókból álló testület értékelte, amely oktatási programokhoz és kiropraktikai klinikai oktatási gyakornoki programokhoz kapcsolódott Ausztráliában és az Egyesült Államokban. A testület tagjait felkérték, hogy vizsgálják felül a skálát, és kommentálják az egyes elemeket és az Általános formátumot. Néhány elemnél kisebb változtatásokat javasoltak, és javasolták egy demográfiai szakasz és egy önreflexiós szakasz felvételét, amely felkérte a diákokat, hogy minősítsék válaszaikat.

a skálát két részre osztottuk. A skála egyik része a beteg kommunikációjára összpontosított, a beteg kommunikációs konfidencia skálája (PCCS). A másik rész a klinikai készségekre összpontosított, a Clinical Skills Confidence Scale (CSCS) címkével. A két skála az önbizalom különböző aspektusait képviseli, mindkettő fontos, és több diagnosztikai információ nyerhető e két különböző szempontról, ha külön-külön mérjük őket, és így láthatjuk, hogy a szintek különböznek-e. Ha a két szempont szintje eltérne, különböző oktatási stratégiák irányulhatnának az egyes szempontok fejlesztésére. Empirikus kérdés, hogy a két skála felfogható-e úgy, hogy ugyanazt a konstrukciót képviselik, és bizonyos célokra egyetlen pontszám lehet minden, ami a tanítási és tanulási döntések meghozatalához szükséges. Ebben az esetben azonban a kutatás célja az volt, hogy információkat szerezzen a két szempontról, mivel ezek mindegyike alapvető fontosságú, és valószínűleg különböző stratégiákat igényelnek ezek kezelésére.

a validálási folyamat segítésére két létező érvényes és megbízható skálát építettek be, a Personal Report of Communication acception (PRCA-24) és a General Self-efficiency (GSE) skálákat. A PRCA-24 skála a másokkal való kommunikáció érzéseit méri. Ebben a tanulmányban azonban csak egy alkategóriát (interperszonális kommunikációt) használtak, mivel a többi alkategóriával általában nem találkoznak klinikai összefüggések. Korábbi kutatások igazolták a PRCA-24 tartalmát, kritériumait és konstrukciós érvényességét . A GSE skálát azért adták hozzá, hogy adatokat gyűjtsenek a hallgatók általános önhatékonyságáról, és összehasonlítsák általános önhatékonyságukat és a konkrét feladathoz kapcsolódó önhatékonysági intézkedéseket. Korábbi kutatások azt mutatják, hogy a GSE megbízható skála konvergens és diszkrimináns érvényességgel, alfa megbízhatósági együtthatókkal .75 hogy .90 . Várható volt, hogy a PCC-k és a CSC-K pozitívan korrelálnak a GSE-vel, és negatívan a PRCA-24 interperszonális kommunikációs alskálával; ezek a korrelációk azonban nem voltak túl magasak, mivel a PRCA-24 és a GSE célja az önbizalomhoz hasonló, de nem azonos konstrukciók értékelése. A végső bizalmi kérdőív (CQ) a következőket tartalmazta:

  1. Általános Önhatékonysági skála (GSE).

  2. személyes jelentés a kommunikációs elfogási skáláról (PRCA-24), interperszonális kommunikációs alskála.

  3. Betegkommunikációs bizalmi skála (PCCS), 28 tétel, 6 válaszkategória, nincs fordított tétel.

  4. Clinical Skills Confidence Scale (CSCS), 27 elem, 6 válaszkategória, nincs fordított elem.

  5. önreflexió szakasz.

  6. demográfiai szakasz.

a PCCS-elemek a betegek kommunikációjának kilenc aspektusát fedték le, mint például a viselkedésváltozás ösztönzése, a történelem felvétele, a magyarázat és a támogatás. A CSC-k a klinikai készségekbe vetett bizalom nyolc aspektusával foglalkoztak, mint például a manipulatív, röntgen és fizikai vizsgálati eljárások.

a résztvevők és a kérdőív adminisztráció

a résztvevők között hét kohorsz kiropraktika diákok (n = 269) beiratkozott szakmai felsőoktatási intézmények Ausztráliában és az Egyesült Államokban. Minden kohorsz hasonló klinikai tantervekkel rendelkezett, amelyek hasonló szakmai tapasztalatokat szolgáltattak, mint például a betegek kórtörténetének rögzítése, valamint a betegek felügyelt értékelése és kezelése. Emberi etikai jóváhagyást és hallgatói beleegyezést kaptak. A CQ—t a hallgatók klinikai gyakorlatának kezdetén adták be, és öt hónappal később megismételték (egy kohorsz-ebben az időben nem volt lehetséges az összes kohorsz újbóli tesztelése), majd tíz hónappal később (minden kohorsz). A PCC-k és a CSC-k érvényességének és megbízhatóságának vizsgálatára csak az első és a harmadik alkalommal (a vizsgálat kezdetén és tíz hónappal később) származó adatokat használták fel. Az adatok ilyen módon történő kombinálása elfogadott eljárás, amelyet a Rasch modell invariáns összehasonlítások tulajdonságai tesznek lehetővé. Az eljárás legitimitása empirikusan tesztelhető a differenciális elem működése (DIF).

Adatelemzés

a 269 visszaküldött kérdőívre adott hallgatói válaszokat két alkalommal pszichometriai elemzésnek vetették alá a polytomous Rasch modell (PRM) segítségével , a Rasch egydimenziós mérési modell szoftver RUMM2030 . Ezt a modellt használták annak megállapítására, hogy a két új skálát sikeresen működtették-e, valamint a skálák érvényességének és megbízhatóságának értékelésére . A Rasch-modellt azért választották, mert ez az egyetlen olyan mérési modell a társadalomtudományokban, amely rendelkezik az összehasonlítások invarianciájának kívánatos skálázási tulajdonságaival . A modell megköveteli, hogy egy adott személycsoportba tartozó bármely két személy közötti összehasonlítás független legyen attól, hogy egy adott termékcsoportba mely tételeket választják az összehasonlításhoz, és egy adott termékcsoportból származó bármely két tétel összehasonlításának függetlennek kell lennie attól, hogy egy adott személycsoportba mely személyeket választják az összehasonlításhoz . A Rasch-paradigma és eljárások részletesebb magyarázatáért lásd például Andrich , Andrich and Styles, Bond and Fox és a rumm2030 szoftver online kézikönyvét . Sok kutató számára a Rasch-paradigma előrelépést jelent a klasszikus tesztelméletben . Mindkét elméletben például a személy teljes pontszáma egy hangszeren az a releváns statisztika, amely képviseli az ember helyzetét az érdeklődő változón vagy tulajdonságon. A klasszikus tesztelméletben használt nyers pontszámok azonban nem linearizáltak (a Rasch-mérésben linearizáltak), és nem kezelhetők mérésként.

a Rasch modell felhasználható az adatok hibáinak vagy problémáinak vizsgálatára, amelyeket a modell illesztésének elmulasztása jelez . Annak kimutatása, hogy egy tétel válaszai (adatai) megfelelnek a modellnek, gyorsírás arra a következtetésre, hogy a tétel a Rasch-modell által összefoglalt egyetlen változó jellemzésére szolgáló skála többi elemével összhangban működik. Ezért, ha egy skála elemkészletére adott válaszok megfelelnek a Rasch-modellnek, akkor azokat belsőleg konzisztensnek tekintik—ami előfeltétele a konstrukció érvényességének megerősítésének. Ezenkívül a személyekre vonatkozó intézkedések jogszerűen alkalmazhatók az alapvető matematikai műveletekben (például az összeadásban), és így szabványos statisztikai eljárásoknak vethetők alá. Két fontos tulajdonság van jelen, ha az adatok megfelelnek a modellnek: először is, a résztvevők mérései lineáris skálán lesznek; másodszor, az intézkedések változatlanok lesznek (a tárgyak és a személyek relatív sorrendje ugyanaz lesz, függetlenül attól, hogy mely elemeket használják a személyek összehasonlítására, és függetlenül attól, hogy mely személyeket használják az elemek összehasonlítására). Ezenkívül a differenciális tétel működésének vizsgálata bizonyítékot szolgáltat arra vonatkozóan, hogy az intézkedések invariánsak-e (lényegében ugyanazt a konstrukciót képviselik-e) a kijelölt csoportok között, amelyek esetében az illesztést megerősítették .

a Rasch-modellben a releváns statisztika bármely személy számára egyszerűen az elemek összesített pontszáma, ahol a pontszámok egymást követő egész számok, amelyeket egymást követő kategóriákhoz rendelnek, ami ugyanaz a statisztika, mint amelyet hagyományosan használnak. Néhány elem lehet dichotóm, és néhánynak kettőnél több rendezett kategóriája lehet. Ezek a pontszámok azonban önmagukban nem lineárisak, és általában nem kezelhetők mérésként. Különösen a padló és a mennyezet hatásai befolyásolják őket, így a nyers pontszám különbsége 2, mondjuk, a konstrukció kontinuumának egyik részén nem képviseli ugyanazt a különbséget, mint a kontinuum másik részén a 2-es pontszám. A nyers pontszámok Rasch modell segítségével történő átalakításával minden egyes személy számára linearizált pontszámok jönnek létre, amelyek mérésként kezelhetők és felhasználhatók a standard statisztikai elemzésekben. Ezeket a linearizált pontszámokat helyeknek nevezzük. Formálisabban a Rasch modell olyan méréseket nyújt, amelyek kompatibilisek a matematikai pszichológiában vizsgált alapvető vagy additív együttes méréssel .

a Rasch-modell valószínűségi modell, amely megfelelő modellt nyújt a tipikus társadalomtudományi adatokhoz. Politómos elemek esetében az egyenlet a következő formát ölti:

Pr X ni, = x ; β n , δ i k = exp x β n − ∑ k = 0 x δ ik / γ ni
(1)

amennyiben (i) X ni , az a véletlen változó, a válasz a személy, n elem, illetve ahol ennek a változónak az értéke egy egész szám 0, 1, 2, 3, …, m, β n az a hely, a személy, a változó, (δ ik ), k = 1, 2, 3, …, m i egy vektor a küszöbértékek az elem, amely a valószínűsége, hogy egy válasz a szomszédos kategóriák azonos, γ ni = ∑ x = 0 m exp x β n − ∑ k = 0 x δ ik összege numerators, valamint biztosítja, hogy az Eq. (1) az összeg 1, és egy valószínűségi nyilatkozat .

a rumm2030 szoftver széles körű lehetőségeket kínál az elemek minőségének értékelésére egy skálán. A létesítmények között számos különböző statisztikai (chi négyzet és log maradék illesztési teszt) és grafikus illesztési teszt (kategória és elem jellemző görbék) található az adatok és a modell között, valamint egy megbízhatósági index, az úgynevezett Személyelválasztási Index (psi). A program információt nyújt a személy és az elemek célzásáról (függetlenül attól, hogy az elem és a személy elhelyezkedése hasonló-e), valamint az elemfüggőségekről és az értelmes részskálák lehetőségéről a maradék elem korrelációk, a maradék főkomponens-elemzés és az alskála-elemzés révén. Ezeket az információkat együttesen használják a skála minőségének megállapítására és az adatok anomáliáinak azonosítására, amelyek a mért konstrukció vagy tulajdonság mélyebb megértéséhez vezethetnek.

a bevezetőben említettek szerint az adatelemzés három elsődleges célt szolgált, amelyek közül az első az egyes skálák belső következetességének és megbízhatóságának megállapítása volt. Más szavakkal, az elemek halmazai mindegyike egyetlen konstrukciót képvisel ezen a skálán? Ha igen, akkor indokolt pontszámokat hozzáadni az egyes skálák összesített pontszámának megszerzéséhez, majd ezeket az összesített pontszámokat (vagy azok linearizált ekvivalenseit, amelyeket helyeknek neveznek) felhasználni más statisztikai tesztekhez, például az átlagos pontszámok összehasonlításához a csoportok között vagy az idő múlásával.

a második cél annak meghatározása volt, hogy az egyes skálák elemei azonos pszichometriai tulajdonságokkal rendelkeznek-e a résztvevők különböző csoportjai között: ezt differenciális Elemműködésnek (DIF) nevezik, és meghatározza, hogy az elemek hasonló pszichometriai tulajdonságokkal rendelkeznek-e a résztvevők különböző csoportjai között, vagyis hogy az elemek invariáns tulajdonságokkal rendelkeznek-e a csoportok között. Ha az elemek csoportonként DIF-et mutatnak, akkor azokat nem szabad a személy teljesítményének összehasonlítására használni, kivéve, ha az egyének ugyanabból a csoportból származnak. Ebben a tanulmányban az érdeklődési csoportok a következők voltak: nem, életkor, a szakmával kapcsolatos tapasztalat, belépési képesítés (korábbi fokozat vagy sem), valamint az adminisztráció alkalmával.

a harmadik cél az volt, hogy bizonyítékot szolgáltassanak a PCC-k és a CSC-k konvergens érvényességére azáltal, hogy megvizsgálták statisztikai korrelációikat a megállapított GSE és PRCA-24 skálákkal, amelyek a bizalom bizonyos aspektusait értékelik.

az első cél elérése érdekében a skálák különböző aspektusait vizsgálták. Az első szempont a válaszkategóriák működése volt. A tételküszöböket (az egymást követő kategóriapárok, például a határozottan egyetértés és az egyetértés közötti vágási pontokat) helyesen kell rendezni. A második szempont az volt, hogy az egyes elemek illeszkedjenek a Rasch modellhez. Ha az elemek megfelelnek a modellnek, ami a belső konzisztencia bizonyítéka, akkor elfogadhatók egyetlen változó méréseként ezen a skálán. Két fit tesztet – egy statisztikai (a chi négyzet) és egy grafikus (az elem jellemző görbék, ICCs) – használtak ennek megítélésére. A Rasch-paradigmában általában egyetlen fit-teszt sem elegendő ahhoz, hogy döntést hozzon a fit-ről. A harmadik szempont a tárgyak és személyek egymáshoz való célzása volt: ezt úgy állapítják meg, hogy megvizsgálják a tárgyak és személyek helyének közös eloszlását ugyanazon a kontinuumon. A negyedik szempontot, az elemfüggőségeket az elemek közötti maradék korrelációk vizsgálatával vizsgáltuk. Ha az elemek függőséget mutatnak, akkor minden párban egy elem redundáns, és mindkettő megtartása mesterségesen növeli a megbízhatóságot. Az ilyen függőségek alskálák jelenlétére is utalhatnak, amelyek tovább vizsgálhatók a maradványok főkomponens-elemzésével. Végül a megbízhatóságot a személy szétválasztási Index (PSI), amely a Rasch megfelelője Cronbach ‘ s alfa.

a második cél elérése érdekében – annak megállapítása, hogy a tételek viszonylag következetesen működnek-e a különböző csoportok között, megvizsgálták a nem, az életkor, a korábbi tapasztalat, a belépési képesítés és az alkalom tekintetében a csoportok közötti differenciált tételeket.

végül, a harmadik cél elérése érdekében, hogy további bizonyítékot szolgáltassanak az érvényességről (ezúttal konvergens érvényesség), a skálán szereplő hallgatói pontszámokat korrelálták ugyanazon hallgatók pontszámaival két létező skálán, amelyek a bizalommal kapcsolatos, de attól eltérő konstrukciókat mérik, és amelyek érvényességét a kutatási szakirodalom megállapította, nevezetesen a GSE és a PRCA-24 (interperszonális kommunikáció).

ezen elemzések eredményei információt szolgáltatnak a két skála érvényességéről és megbízhatóságáról. Ha ezek kielégítőek, a személyek elhelyezkedését (a linearizált nyers pontszámokat) fel lehet használni további elemzésekhez, például a különböző érdeklődési csoportok átlagos pontszámainak (személyek elhelyezkedésének) összehasonlításához, valamint az átlagos helyek időbeli változásainak vizsgálatához.

Vélemény, hozzászólás?

Az e-mail-címet nem tesszük közzé.