14クラスターサンプリングの長所と短所

クラスターサンプリングは、集団を別々のグループに配置するサンプリング方法です。 次に、これらのグループの無作為標本を選択して、特定の母集団を表します。 これは、人口や人口統計に関する情報を全体として見つけるための実行可能な方法がない場合、通常、市場調査に使用されるプロセスです。

クラスタサンプリングが情報収集の正確な形態であるためには、3つの要件を満たす必要があります。

  1. グループは、各クラスター内に異なるサブポピュレーションを含む、可能な限り異質でなければなりません。
  2. 各グループは、人口または人口統計学全体が何であるかをより小さく表現する必要があります。
  3. グループは、データの重複を防ぐために相互に排他的でなければなりません。 2つのクラスターが一緒に発生することはできません。

これらの要件が満たされると、実行できるクラスタサンプリングには二つのタイプがあります。 シングルステージクラスターサンプリングでは、選択された各クラスター内のすべての要素が使用されます。 二段クラスタサンプリングでは,選択したクラスタに対して無作為化サンプリング技術を用いて情報を生成する。

クラスタサンプリングの長所と短所を見るときに考慮すべき重要なポイントは次のとおりです。

クラスタサンプリングの利点のリスト

1. それは研究が減らされた経済と行なわれることができるように可能にする。

特定の人口統計学やコミュニティを調査する場合、グループ内のすべての世帯や個人にインタビューするコストは非常に制限されます。 クラスタサンプリングを使用することにより、正確なデータを生成するために必要な数を減らすことによって、特定の人口統計やコミュニティに関す 関係するすべての人の完全な研究プロセスなしでは100%正確なデータはありませんが、クラスターサンプリングは非常に低い誤差範囲内で結果を得ます。

2. クラスターサンプリングは変動性を低減します。

すべての形式のサンプリングが推定値を作成します。 クラスターサンプリングが提供するのは、クラスターが適切にまとめられたときに、より正確な推定プロセスです。 各クラスターが研究されている一般集団を代表するものであると仮定すると、この方法で得られた情報は、グループ全体をより正確に反映しているため、結果の変動性が低下しました。

3. それはより実現可能なアプローチです。

完全な人口統計学的またはコミュニティのサンプリングから必要とされる大規模なデータ入力を管理する能力は、平均的な研究者にとっては実現 クラスターサンプリングアプローチの設計は、特に大きな母集団を考慮することを意図しています。 大規模な母集団を代表するデータを見つける必要がある場合は、クラスターサンプリングを使用すると、収集した情報を使用可能な形式に外挿す

4. 集りの見本抽出は複数の区域から取ることができる。

クラスターは、単一のコミュニティ、複数のコミュニティ、または複数の人口統計内で定義できます。 情報を取得するために使用される手順は、サンプルの大きさに関係なく、同じプロセスに従います。 つまり、研究者は、特定の家のランダムなサンプルを使用して、近所についての使用可能な情報を生成することができます。 彼らはまた、国家レベルの結果を生成するために、さまざまな分野の人口統計に近づくことによって、大規模な情報を発見することができます。

5. それは無作為抽出および層別にされた見本抽出の利点がある。

クラスターサンプリングをこのような有益な方法にするのは、無作為化サンプリングと層別サンプリングのすべての利点をそのプロセスに含 これは、収集された情報内の人間の偏見の可能性を減らすのに役立ちます。 それはまた任意変化によって引き起こされる否定的な影響の危険を減らす情報アセンブリプロセスを簡単にする。 結合されると、サンプルから得られた結果は、より大きな集団に適用することができる結論を生成することができる。

6. クラスタサンプリングは大きなデータサンプルを作成します。

クラスターサンプルを使用してデータの大きなサンプルを作成する方が、その構造のためにはるかに簡単です。 クラスターが設計され配置されると、収集される情報は各クラスターから同様になります。 これにより、データポイントを比較し、特定の母集団グループ内で結論を見つけ、時間の経過とともに異なるクラスターがどのように進化するかを見ることができる追跡情報を生成することが可能になります。

クラスタサンプリングのデメリット一覧

1. クラスタサンプリング内でバイアスされたデータを作成する方が簡単です。

各クラスターの設計は、サンプリングプロセスから収集されるデータの基礎です。 研究されている母集団を表す正確なクラスターは、正確な結果を生成します。 研究者が個人的な偏見を反映するために特定の結果を作成しようとしている場合は、特定の方法でクラスターを構造化することによって偏見を反映 たとえそれが無意識のバイアスであっても、データは構造化を反映しており、正確さの誤った印象を作り出します。

2. サンプリング誤差は大きな問題になる可能性があります。

クラスターサンプリングによって収集された情報は、研究者のスキルに大きく依存しています。 情報または収集方法が標準以下の場合、収集されたデータは可能な限り有益ではありません。 そのようなデータで見つかったエラーは、実際には一般人口の不正確な反映である可能性がある場合、正当なポイントであるように見えます。 そのため、研究分野に慣れていない人は、最初の方法としてクラスターサンプリングを使用することはお勧めしません。

3. 多くのクラスターは、自己識別情報に基づいて配置されます。

研究者は、多くの場合、自己識別情報に基づいて個人または世帯のクラスター配置を決定します。 つまり、個人が何らかの方法で自分自身を誤って表現することによって、データの品質に影響を与えることができます。 負の影響力を生み出すために必要なのは、収入、民族性、または政治的嗜好の虚偽表示だけです。 研究者による配置プロセスの不十分な構造化は、配置プロセスにも混乱を加える可能性があります。 また、自分の目的のために研究を歪曲するために意図的に別のクラスターとして識別する個人もあるかもしれません。

4. すべてのクラスターには、重複するデータポイントがある場合があります。

クラスタサンプリングの目標は、データの重複を減らすことであり、これは発見される結論の完全性に影響を与える可能性があります。 ただし、クラスターを作成する場合、すべての人口統計、コミュニティ、または人口グループには、個々のレベルである程度の重複があります。 これは、定期的にサンプリング誤差を作成するデータ内の変動のレベルを作成します。 場合によっては、サンプリング誤差は、データの代表的な性質を減らすのに十分な大きさであり、結論を無効にする可能性があります。

5. 効果的であるためには、サイズの平等が必要です。

クラスタサンプリングの主な欠点の一つは、正確な結論につながるためにはサイズが等しい必要があることです。 1つのクラスターが2,000人の代表的なサンプルを持ち、2つ目のクラスターが1,000人、残りのすべてが500人の場合、最初の2つのクラスターは結論では過小表 このプロセスは、データの不一致を引き起こす可能性があり、そのため、識別が困難な大きなサンプリング誤差が生じます。

6. クラスターサンプリングからの結果は、これらの母集団グループにのみ適用されます。

クラスターサンプリングで生じる問題は、それらに含まれる母集団がその特定のグループの代表だけであるという事実です。 たとえば、ノースカロライナ州の都市を調査する場合、その調査から得られた情報は、米国の一般人口に正確に適用することはできませんでした。 それは州の人口にとってのみ正確であり、それでも地域の不一致に基づいて調査結果を適用することはできないかもしれません。 そのため、研究が正確であるためには、各クラスターのための強力な定義が必要です。

7. 正確さのためには、最小数のケースが必要です。

クラスターサンプリングは、研究が生成するサンプリング誤差を低減するために、複数の研究ポイントを必要とします。 高レベルの研究がなければ、データが重複する可能性が高くなります。 また、各クラスターから取得される例が少ない場合、このプロセスを通じて片側データを取得するリスクも高くなります。

8. クラスターサンプリングは、人を単位として分類できる場合にのみうまく機能します。

クラスターサンプリングに関わるプロセスでは、人を個人ではなく単位として分類する必要があります。 それは、彼らが「共和党員」や「民主党員」のような特定のグループと識別される必要があることを意味します。”個々のデータポイントを収集する必要がある場合は、別の形式の研究が必要です。

これらのクラスタサンプリングの長所と短所は、他のサンプリング方法の時間やコストの投資なしに、大きな母集団に関する特定の情報を見つ 同時に、タイトなコントロールと強力な研究者のスキルがなければ、誤った結果に研究者を導くことができ、この情報に発見されたより多くのエラーが そのため、エリアサンプリングに精通している経験豊富な研究者だけが定期的にこの形式の研究を使用する必要があります。

著者について
何百万人もの人々が毎月Brandonのブログを訪問していますが、成功への彼の道は容易ではありませんでした。 彼の信じられないほどの物語を読むためにここに行きなさい、”負債の不能および$500kからの5百万の月例訪問者が付いているプロBloggerに。”Brandonに簡単なメッセージを送信したい場合は、ここで彼の連絡先ページをご覧ください。

コメントを残す

メールアドレスが公開されることはありません。