マニュアル医学における専門家の信頼を測定するためのスケールの開発と心理測定評価:A Rasch measurement approach

スケールの開発

様々な非公式の学生のグループインタビューや文献の批判的レビューから得られたデータは、自信スケールと最終的な自信アンケートの内容と目的を形作るのに役立った。 項目とその形式は、関連するスケールと健康教育研究を慎重に検討した後に開発され、教育または臨床インターンシップの設定における専門的な自信を評価するためのさまざまな方法を実証しました。 これらの研究は現在の研究の目的を反映していませんでしたが、健康教育プログラムにおける専門的な自信の重要性に関する重要な証拠を提 運動訓練,カイロプラクティックおよび理学療法カリキュラムにおける著者の豊富な経験に基づいて,いくつかの項目を開発した。 彼らは、健康リスク行動(食事、薬物使用、運動)、整形外科用ブレースの適用、サポートとテーピング、リハビリ手順の実証を議論する能力に焦点を当てたものでした。

したがって、52項目または声明の予備的な手段は、患者のコミュニケーションと臨床スキルに主な焦点を当てて開発され、(非公式のインタビューと文献の批判的なレビューを通じて特定された自信における役割のために)臨床医の監督に二次的な焦点を当てた。 各項目のための六点Likertスタイルの応答形式が利用されました。 応答カテゴリは、1(”まったく自信がない”)から6(”非常に自信がある”)にコード化されました。 質問は、学生が遭遇する可能性が高い患者との相互作用と経験を反映しており、一般的な健康問題の議論から基本的で集中した身体検査手順の実 例えば:”新しい患者と個人的なおよび/または敏感な問題を論議するあなたの機能でいかに確信しているか。”; そして”患者の血圧、脈拍および呼吸率のような基本的な身体検査のプロシージャを行うあなたの機能でいかに確信しているか。”コンテンツの有効性は、オーストラリアと米国の教育プログラムとカイロプラクティック臨床教育インターンシッププログラムに所属する教育者と研究者のパ パネルメンバーは、スケールを確認し、各項目と全体的な形式についてコメントするよう求められました。 彼らはいくつかの項目のためのマイナーな変更を提案し、彼らの応答を修飾するために学生を招待し、人口統計学のセクションと自己反省のセクション

スケールは二つの部分に分かれていた。 患者コミュニケーションに焦点を当てたスケールの一部は、患者コミュニケーション信頼スケール(PCCS)とラベル付けされています。 他の部分は、臨床スキルに焦点を当て、臨床スキル自信スケール(CSCS)と呼ばれていました。 これらの2つの異なる側面についてのより多くの診断情報は、それらを別々に測定し、レベルが異なるかどうかを確認することによって得ることが 二つの側面のレベルが異なる場合は、異なる教育戦略は、各側面を開発することを目的とすることができます。 二つの尺度が同じ構成を表すものとして考えられるかどうかは経験的な問題であり、いくつかの目的のために、単一のスコアが教育と学習の決定を しかし、この場合、研究は、それぞれが不可欠であり、それらに対処するために異なる戦略を必要とする可能性が高いため、2つの側面のそれぞれに関

検証プロセスを支援するために、既存の有効で信頼性の高い尺度であるPersonal Report of Communication Apprehension(PRCA-24)とGeneral Self-efficiency(GSE)の二つの尺度が組み込まれました。 PRCA-24スケールは他と伝達し合うことについての感じを測定する。 しかし、この研究では、他のサブカテゴリは臨床的文脈では一般的に遭遇しないため、1つのサブカテゴリ(対人コミュニケーション)のみが使用された。 以前の研究では、PRCA-24の内容、基準、および構造の妥当性が実証されています。 GSEスケールは、学生の一般化された自己効力に関するデータを収集し、一般的な自己効力と特定のタスク関連の自己効力測定を比較するために追加され 以前の研究では、gseは収束と判別妥当性を持つ信頼性の高いスケールであり、アルファ信頼性係数はからの範囲であることが示されています。75へ.90 . PCCSとCSCSはGSEと正の相関を持ち、PRCA-24対人コミュニケーションのサブスケールと負の相関を持つことが期待されていたが、PRCA-24とGSEは自信と類似しているが同一ではない構築物を評価するように設計されているため、これらの相関はあまり高くないと予想されていなかった。 最終的な信頼アンケート(CQ)には、次のものが含まれていました:

  1. 一般的な自己効力スケール(GSE)。

  2. コミュニケーション不安スケール(PRCA-24)の個人的なレポート、対人コミュニケーションサブスケール。

  3. 患者コミュニケーション信頼度尺度(PCCS)、28項目、6応答カテゴリ、逆の項目はありません。

  4. 臨床スキル自信スケール(CSCS)、27項目、6応答カテゴリ、逆の項目はありません。

  5. 自己反射セクション。

  6. 人口統計学のセクション。

PCCSの項目は、行動の変化を奨励する、歴史を取る、説明する、支持するなど、患者とのコミュニケーションの9つの側面をカバーしました。 CSCSは、整体、X線、および身体検査手順などの臨床スキルに対する自信の8つの側面に対処しました。

参加者とアンケート管理

参加者には、オーストラリアと米国の高等教育機関でインターンシップに登録されているカイロプラクティック学生(n=269)の七コホートが含まれていた。 すべてのコホートは、患者の履歴を記録し、患者の監督された評価と治療などの同様の専門的な経験を提供する同等の臨床カリキュラムを持っていた。 人間の倫理の承認および学生の同意は得られました。 CQは、学生の臨床インターンシップの開始時に投与され、五ヶ月後(一つのコホート—この時点ですべてのコホートを再テストすることは不可能であった)、再び十ヶ月後(すべてのコホート)に繰り返された。 PCCSおよびCSCSの妥当性および信頼性を調べるために、最初および3回目(研究の開始および10ヶ月後)のデータのみを使用した。 このようにデータを組み合わせることは、Raschモデルの不変比較の特性によって可能になる受け入れられた手順です。 手順の正当性は、差分アイテム機能(DIF)を使用して経験的にテストすることができます。

データ分析

269回にわたって返されたアンケートに対する学生の回答は、Rasch一次元測定モデルソフトウェアRUMM2030を介して、polytomous Raschモデル(PRM)を用いた心理分析に提出された。 このモデルは、2つの新しいスケールが正常に運用されたかどうかを確認し、スケールの妥当性と信頼性の側面を評価するために使用されました。 Raschモデルは、比較の不変性の望ましいスケーリング特性を有する社会科学における唯一の測定モデルであるために選択された。 このモデルでは,与えられたクラスの人物からの任意の二つの人物間の比較は,与えられたクラスの項目のどの項目が比較のために選択されるかとは独立していなければならず,与えられたクラスの項目からの任意の二つの項目の比較は,与えられたクラスの人物のどの人物が比較を行うために選択されるかとは独立していなければならない。 Raschパラダイムおよび手順のより詳細な説明については、例えば、Andrich,Andrich and Styles,Bond and FoxおよびRUMM2 0 3 0ソフトウェアのオンラインマニュアルを参照されたい。 多くの研究者にとって、Raschパラダイムは古典的なテスト理論の進歩を表しています。 両方の理論では、例えば、楽器上の人の合計スコアは、関心のある変数またはプロパティ上の人の地位を表すための関連する統計量です。 しかし、古典的なテスト理論で使用される生のスコアは線形化されておらず(Rasch測定では線形化されています)、測定値として扱うべきではありません。

Raschモデルを使用して、モデルの適合に失敗したことによって示される欠陥または問題のデータを調べることができます。 アイテムの応答(データ)がモデルに適合することを示すことは、アイテムが他のアイテムと一貫してスケールで動作し、Raschモデルによって要約された単一の変数を特徴付けることを結論づけるための省略形です。 したがって、スケール内の一連の項目に対する応答がRaschモデルに適合する場合、それらは内部的に一貫しているとして確立されます。 さらに、人のための措置は、基本的な数学的演算(加算など)で合法的に使用され、したがって標準的な統計的手順を受けることができる。 データがモデルに適合する場合、2つの重要な特性が存在します。; そして、第二に、尺度は不変である(アイテムと人物の相対的な順序は、どのアイテムが人物を比較するために使用されていても、どの人物がアイテムを比較するために使用されていても同じである)。 さらに、微分項目機能の検査は、適合が確認された指定されたグループにわたって、尺度が不変であるかどうか(本質的には、それらが同じ構成を表すかどうか)の証拠を提供する。

Raschモデルでは、すべての人の関連統計は、スコアが連続するカテゴリに割り当てられた連続する整数であり、従来使用されていた統計と同じである、項目間の合計スコアです。 いくつかの項目は二分的であり、いくつかは二つ以上の順序付けられたカテゴリを持つことができます。 しかし、これらのスコアはそれ自体線形ではなく、一般的に測定値として扱われるべきではありません。 特に、それらは床および天井の効果によって影響されるので、構成体の連続体のある部分での生のスコア2の差は、連続体の別の部分でのスコア2と同 Raschモデルを使用した生のスコアの変換は、測定値として扱われ、標準的な統計分析で使用することができる各人の線形化されたスコアを生成する。 これらの線形化されたスコアは、場所として知られています。 より正式には、Raschモデルは、数学心理学で研究されている基本的または加法的コンジョイント測定と互換性のある測定値を提供します。

Raschモデルは、典型的な社会科学データに適切なモデルを提供する確率的モデルです。 多項項目の場合、方程式は次の形式をとります:

Pr×ni,=x ; β n,δ i k=exp x β n−γ k=0x δ ik/γ ni
(1)

ここで、(i)x niは、アイテムiに対する人物nの応答の確率変数であり、この変数の値は整数です0, 1, 2, 3, …, m,β nは変数上の人物の位置であり、(δ ik),k=1,2,3,…,m iは、隣接するカテゴリにおける応答の確率が同一である項目iのしきい値のベクトルであり、μ ni=μ x=0m exp x β n−μ k=0x δ ikは分子の和であり、式が成り立つことを保証する。 (1)は1に合計し、確率文です。

RUMM2030ソフトウェアは、スケール内のアイテムの品質を評価するための広範な機能を提供します。 施設には、データとモデル間のいくつかの異なる統計的(カイ二乗検定および対数残差検定)および適合のグラフ的検定(カテゴリおよび項目特性曲線)、および人分離指数(PSI)として知られている信頼性の指標が含まれる。 また、人とアイテムのターゲティング(アイテムと人の場所の広がりが似ているかどうか)、残差アイテム相関、残差主成分分析、サブスケール分析を通じて、アイテムの依存関係と意味のあるサブスケールの可能性についての情報を提供します。 組み合わせて、この情報は、スケールの品質を確認し、測定される構造または特性のより深い理解につながる可能性があるデータの異常を識別するために

はじめに述べたように、データ分析は三つの主要な目的に対処し、その最初の目的は各スケールの内部の一貫性と信頼性を確立することでした。 言い換えれば、アイテムのセットは、それぞれこのレベルのスケールで単一の構成を表していますか? そうであれば、スコアを追加して各スケールの合計スコアを取得し、それらの合計スコア(または場所として知られている線形化された同等物)を他の統計的検定のために使用することが正当化されますグループ間または時間の経過による平均スコアの比較。

第二の目的は、各スケールの項目が参加者の異なるグループ間で同じ心理測定特性を持っているかどうかを判断することでした。 項目にグループ間でDIFが表示される場合は、個人が同じグループのものでない限り、個人のパフォーマンスを比較するために使用しないでくださ この研究では、関心のあるグループは、性別、年齢、職業経験、入学資格(以前の学位かどうか)、および管理の機会でした。

第三の目的は、信頼性のいくつかの側面を評価する確立されたGSEおよびPRCA-24スケールとの統計的相関を調べることにより、PCCSおよびCSCSの収束的妥当性の証拠を提供することであった。

最初の目的に対処するために、スケールのさまざまな側面が検討されました。 最初の側面は、応答カテゴリの操作でした。 アイテムのしきい値(強く同意し、同意するなどのカテゴリの各連続するペアの間のカットポイント)は、正しく順序付けされている必要があります。 第二の側面は、Raschモデルへのアイテムの各セットの適合でした。 項目が内部一貫性の証拠であるモデルに適合する場合、このレベルのスケールで単一の変数を測定するものとして受け入れることができます。 これを判断するために、1つの統計的(カイ二乗)と1つのグラフ的(項目特性曲線、ICCs)の2つの適合検定を使用しました。 Raschパラダイムでは、一般的に、適合の検定は、適合についての決定を下すのに十分ではありません。 これは、同じ連続体上のアイテムと人の場所の共同分布を調べることによって確立されます。 第四の側面、アイテムの依存性は、アイテム間の残差相関の検査によって検討されました。 アイテムが依存関係を示す場合、各ペアの1つのアイテムは冗長であり、両方を人為的に保持すると信頼性が向上します。 このような依存性は、残差の主成分分析を通じてさらに調べることができるサブスケールの存在を示すこともできる。 最後に、信頼性はCronbachのアルファのRaschの等量である人の分離の索引(PSI)を使用して測定される。

第二の目的に対処するために–項目が異なるグループ間で比較的一貫して動作するかどうかを確立するために、性別、年齢、以前の経験、エントリ資格およ

最後に、妥当性のさらなる証拠(今回は収束妥当性)を提供するための第三の目的に対処するために、スケール上の学生のスコアは、信頼に関連するが、信頼とは

これらの分析の結果は、2つの尺度の妥当性と信頼性に関する情報を提供する。 これらが満足のいくものであれば、個人の位置(線形化された生のスコア)は、例えば、関心の異なるグループの平均スコア(個人の位置)の比較、および時間の経過に伴う平均位置の変化の調査のようなさらなる分析に使用することができる。

コメントを残す

メールアドレスが公開されることはありません。