14 클러스터 샘플링 장점과 단점

클러스터 샘플링은 모집단이 별도의 그룹으로 배치되는 샘플링 방법입니다. 그런 다음 이러한 그룹의 무작위 샘플을 선택하여 특정 모집단을 나타냅니다. 그것은 일반적으로 인구 또는 전체 인구 통계에 대 한 정보를 찾을 수 없는 가능한 방법은 시장 조사에 대 한 사용 되는 프로세스입니다.

클러스터 샘플링이 정확한 형태의 정보 수집이 되려면 3 가지 요구 사항을 충족해야 합니다.

  1. 그룹은 가능한 한 이종 적이어야하며 각 클러스터 내에 독특하고 다른 하위 집단을 포함해야합니다.
  2. 각 그룹은 전체 인구 또는 인구 통계가 어떻게되는지에 대한 더 작은 표현을 제공해야합니다.
  3. 그룹은 데이터 중복을 방지하기 위해 서로 상호 배타적이어야 합니다. 두 개의 클러스터가 함께 발생할 수는 없습니다.

이러한 요구 사항이 충족되면 수행 할 수있는 두 가지 유형의 클러스터 샘플링이 있습니다. 단일 단계 클러스터 샘플링에서 선택한 각 클러스터의 모든 요소가 사용됩니다. 2 단계 클러스터 샘플링에서 무작위 샘플링 기술은 선택한 클러스터에 정보를 생성하는 데 사용됩니다.

다음은 클러스터 샘플링의 장점과 단점을 살펴볼 때 고려해야 할 핵심 사항입니다.

클러스터 샘플링의 장점 목록

1. 그것은 감소 된 경제로 연구를 수행 할 수있게합니다.

특정 인구 통계 학적 또는 지역 사회를 조사한다면,그룹 내의 모든 가구 또는 개인을 인터뷰하는 비용은 매우 제한적일 것입니다. 클러스터 샘플링을 사용하면 정확한 데이터를 생성하는 데 필요한 수를 줄임으로써 특정 인구 통계 또는 커뮤니티에 대한 정보를 컴파일 할 수 있습니다. 관련된 모든 사람의 완전한 연구 프로세스 없이는 데이터가 100%정확하지 않지만 클러스터 샘플링은 매우 낮은 오차 범위 내에서 결과를 얻습니다.

2. 클러스터 샘플링은 변동성을 줄입니다.

모든 형태의 샘플링은 추정치를 생성합니다. 클러스터 샘플링이 제공하는 것은 클러스터를 적절하게 조합했을 때 보다 정확한 추정 프로세스입니다. 각 클러스터가 연구중인 일반 인구를 대표한다고 가정 할 때,이 방법을 통해 얻은 정보는 전체 그룹의보다 정확한 반영이기 때문에 결과의 가변성을 감소 시켰습니다.

3. 그것은 더 실현 가능한 접근 방식입니다.

전체 인구 통계 학적 또는 지역 사회 샘플링에 필요한 것 큰 데이터 입력을 관리 할 수있는 능력은 평균 연구자에 대한 가능하지 않을 것입니다. 군집 표본 추출 접근의 디자인은 특히 큰 인구를 고려하기 위하여 예정됩니다. 대규모 모집단 그룹을 대표하는 데이터를 찾아야 하는 경우 클러스터 샘플링을 사용하면 수집된 정보를 사용 가능한 형식으로 추정할 수 있습니다.

4. 클러스터 샘플링은 여러 영역에서 가져올 수 있습니다.

클러스터는 단일 커뮤니티,여러 커뮤니티 또는 여러 인구통계 내에서 정의할 수 있습니다. 정보를 얻기 위해 사용되는 절차는 샘플이 얼마나 크든 상관없이 동일한 프로세스를 따릅니다. 즉,연구자들은 특정 가정의 무작위 샘플을 사용하여 이웃에 대한 사용 가능한 정보를 생성 할 수 있습니다. 그들은 또한 국가 수준의 결과를 생성하기 위해 다른 지역의 인구 통계에 접근하여 대규모 정보를 발견 할 수 있습니다.

5. 무작위 샘플링 및 계층화 샘플링의 장점을 제공합니다.

클러스터 샘플링을 이러한 유익한 방법으로 만드는 것은 그 과정에서 무작위 샘플링과 계층화 샘플링의 모든 이점을 포함한다는 사실입니다. 이는 수집 된 정보 내에서 인간의 편향 가능성을 줄이는 데 도움이됩니다. 또한 정보 조립 프로세스를 단순화하여 무작위 변형으로 인한 부정적인 영향의 위험을 줄입니다. 결합 할 때,샘플에서 얻은 결과는 더 큰 모집단에 적용 할 수있는 결론을 생성 할 수 있습니다.

6. 클러스터 샘플링은 대용량 데이터 샘플을 만듭니다.

구조 때문에 클러스터 샘플을 사용하여 더 큰 데이터 샘플을 만드는 것이 훨씬 쉽습니다. 클러스터가 설계되고 배치되면 수집되는 정보는 각 클러스터에서 유사합니다. 이를 통해 데이터 포인트를 비교하고,특정 인구 집단 내에서 결론을 찾고,시간이 지남에 따라 다른 클러스터가 어떻게 진화 하는지를 볼 수있는 추적 정보를 생성 할 수 있습니다.

클러스터 샘플링의 단점 목록

1. 클러스터 샘플링 내에서 편향된 데이터를 만드는 것이 더 쉽습니다.

각 클러스터의 설계는 샘플링 프로세스에서 수집될 데이터의 기초입니다. 연구중인 인구를 나타내는 정확한 클러스터는 정확한 결과를 생성합니다. 연구자가 개인적인 편견을 반영하기 위해 특정 결과를 만들려고 시도하는 경우 클러스터를 특정 방식으로 구조화하여 편견을 반영하는 데이터를 생성하는 것이 더 쉽습니다. 이 무의식적 바이어스 인 경우에도,데이터는 정확성의 잘못된 인상을 만드는 구조의 반영 될 것입니다.

2. 샘플링 오류는 큰 문제가 될 수 있습니다.

클러스터 샘플링을 통해 수집 된 정보는 연구자의 기술에 크게 의존합니다. 정보 또는 수집 방법이 평균 이하인 경우 수집 된 데이터는 가능한 한 유익하지 않습니다. 이러한 데이터에서 발견 된 오류는 실제로 일반 인구의 부정확 한 반영 일 수있는 합법적 인 지점으로 보입니다. 이러한 이유로 연구 분야에 새로운 사람은 클러스터 샘플링을 초기 방법으로 사용하지 않는 것이 좋습니다.

3. 많은 클러스터가 자체 식별 정보를 기반으로 배치됩니다.

연구원은 종종 자기 식별 정보를 기반으로 개인 또는 가구의 클러스터 배치를 결정합니다. 즉,개인은 어떤 식 으로든 자신을 잘못 설명함으로써 데이터의 품질에 영향을 줄 수 있습니다. 부정적인 영향을 미치기 위해 취할 수있는 모든 것은 소득,민족성 또는 정치적 선호도의 잘못된 진술입니다. 연구자에 의해 배치 과정에서 부적절한 구조뿐만 아니라 배치 과정에 혼란을 추가 할 수 있습니다. 또한 자신의 목적을 위해 연구를 왜곡하기 위해 의도적으로 다른 클러스터로 식별하는 개인이있을 수 있습니다.

4. 모든 클러스터에는 겹치는 데이터 요소가있을 수 있습니다.

클러스터 샘플링의 목표는 데이터의 중복을 줄이는 것이며,이는 발견될 수 있는 결론의 무결성에 영향을 미칠 수 있다. 그러나 클러스터를 만들 때 모든 인구 통계,커뮤니티 또는 인구 그룹은 개별 수준에서 어느 정도 겹칩니다. 이는 데이터 내에서 정기적으로 샘플링 오류를 생성하는 수준의 가변성을 만듭니다. 경우에 따라 샘플링 오류가 데이터의 대표적인 특성을 감소시키기에 충분히 커서 결론이 무효화될 수 있습니다.

5. 그것은 크기 평등이 효과적 일 것을 요구한다.

클러스터 샘플링의 주요 단점 중 하나는 정확한 결론을 이끌어 내기 위해 크기가 동일해야한다는 것입니다. 한 클러스터에 2,000 명의 대표 샘플이 있고 두 번째 클러스터에는 1,000 명이 있고 나머지 모든 클러스터에는 500 명이 있다면 처음 두 클러스터는 결론에서 과소 표현되고 작은 클러스터는 과도하게 표현 될 것입니다. 이 프로세스는 식별하기 어려울 수 있습니다 큰 샘플링 오류를 생성하는 데이터 차이로 이어질 수 있습니다.

6. 클러스터 샘플링의 결과는 해당 인구 집단에만 적용됩니다.

클러스터 샘플링과 함께 오는 문제는 그들이 포함하는 인구가 특정 그룹의 대표 만 있다는 사실이다. 예를 들어,노스 캐롤라이나의 도시를 조사한다면,그 연구에서 얻은 정보는 미국의 일반 인구에게 정확하게 적용될 수 없었습니다. 그것은 단지 국가의 인구에 대한 정확한 것,심지어 다음,지역 불일치에 따라 결과를 적용 할 수 없습니다. 그렇기 때문에 연구가 정확하기 위해서는 각 클러스터에 대해 강력한 정의가 있어야합니다.

7. 정확성을 위해 최소 사례 수가 필요합니다.

클러스터 샘플링은 연구가 생성하는 샘플링 오류를 줄이기 위해 여러 연구 포인트가 필요합니다. 높은 수준의 연구가 없으면 데이터 중복 가능성이 증가합니다. 또한 각 클러스터에서 더 적은 수의 예제를 가져 오는 경우이 프로세스를 통해 일방적 인 데이터를 얻을 위험이 더 높습니다.

8. 클러스터 샘플링은 사람들이 단위로 분류 될 수있는 경우에만 잘 작동합니다.

클러스터 샘플링과 관련된 프로세스는 사람들이 개인이 아닌 단위로 분류되어야 합니다. 즉,그들은”공화당”또는”민주당 원”과 같은 특정 그룹으로 식별 될 필요가 있음을 의미합니다.”개별 데이터 포인트를 수집해야하는 경우 다른 형태의 연구가 필요합니다.

이러한 클러스터 샘플링 장점과 단점은 다른 샘플링 방법의 시간 또는 비용 투자없이 대규모 인구에 대한 특정 정보를 찾는 데 도움이 될 수 있습니다. 동시에,엄격한 통제와 강력한 연구원 기술 없이는 연구원이 잘못된 결과를 초래할 수있는이 정보에서 더 많은 오류가 발견 될 수 있습니다. 이러한 이유로 지역 샘플링에 익숙한 숙련 된 연구자 만이 정기적으로 이러한 형태의 연구를 사용해야합니다.

저자 소개
매달 수백만 명의 사람들이 브랜든의 블로그를 방문하지만,성공의 길은 쉽지 않았습니다. “장애인 및 5 억 달러의 부채에서 5 백만 명의 월간 방문자가있는 프로 블로거에 이르기까지 그의 놀라운 이야기를 읽으려면 여기로 이동하십시오.”당신이 브랜든에게 빠른 메시지를 보내려면,여기에 자신의 연락처 페이지를 방문하십시오.

답글 남기기

이메일 주소는 공개되지 않습니다.