본문 바로가기

공부/통계학

통계-표본 추출 방법(층화 표본 추출법, 군집표본추출)

안녕하세요! 눈꽃입니다~

이번 포스팅에서는 통계학에서 사용되는 표본 추출 방법 중 층화 표본 추출법에 대해 알아보겠습니다!
(다른 표본 추출법인 단순 랜덤 표본 추출법에 대해 알아보고 싶으시면 다음 링크 타고 들어가시면 도움이 되실 거예요!)

 

1. 층화 표본추출

: 대학생의 인식조사를 할 때 단순 랜덤표본을 사용하는 경우 우연히 1,2학년 학생이 대거 뽑히고 3,4학년 학생은 거의 뽑히지 않는다면 저학년 학생들의 의견이 너무 많이 반영될 수 있다는 우려가 있을 수 있습니다! 이런 경우 1, 2, 3, 4학년을 나누어서 각 학년 안에서 주어진 크기의 단순랜덤 표본을 추출하는 층화 표본추출(stratified sampling)을 이용할 수 있습니다!

 다시 정리해보면, 층화 추출은 모집단을 몇 개의 '층'으로 나누어 각 층에서 단순랜덤표본을 뽑는 방법으로, 모집단에 속하는 개체가 어느 층(stratum)에 속하는지를 알아야 합니다. 각 층 내부는 동질적인 속성을 갖는 반면에, 각 층들 간에는 이질적인 배타적 속성을 갖습니다. 이러한 층화 표본 추출은 층을 구성하는 하위집단에 대한 정보(ex. 1, 2, 3, 4학년)가 주어지며 각 층이 동질적인 경우 통계적 정밀도를 높일 수 있다는 장점이 있습니다!
위 예시를 대입해서 생각해보면 학년이 '층'이 되는 것이며, 같은 층에서는 같은 학년이라는 동질성을 갖습니다! 다른 학년일 경우에는 다른 층이 되며, 이질성이 있다고 볼 수 있겠죠!

 

다른 예시로는 '경제활동 인구 조사'를 들 수 있습니다! 경제활동 인구 조사는 인구주택 총조사 자료를 표본추출 틀로 사용합니다! 표본의 모집단에 대한 대표성을 확보하기 위해서 공표단위인 7개의 도시와 9개 도로 층화하였고, 9개의 도에 대해서는 도시지역인 '동부'와 군 혹은 읍면 지역인 '읍면부'로 다시 층화하였습니다!(읍면부와 동부는 고용형태나 소득 및 소비 형태, 소비 구조 등에 차이가 있기 때문입니다! 참고로 이와 같이 단일한 기준이 아닌 여러 층을 기준으로 표본을 나누는 경우를 다단계 층화 표본 추출이라고 합니다!)

이와 같은 층화 방법은 각 층 내에서는 동질적이고 층 사이에는 이질적인 모집단의 통계처리 시, 통계의 정밀성을 높일 수 있을 뿐만 아니라, 더 나아가 공표단위(7개의 도시와 9개의 도) 별로 독립적인 추정이 가능하다는 장점이 있다는 것을 알아두시면 도움이 됩니다!

 

2.군집표본추출

: 단순랜덤추출법, 층화표본추출법 다음으로 다뤄볼 표본 추출 방법은 군집표본추출(cluster sampling)입니다! 군집표본 추출법은 표본 추출단위로 개체 각각이 아닌 개체들로 이루어진 '집단'을 무작위로 선정한 후, 그 선정된 집단들 내에 있는 모든 개체들을 표본으로 추출하는 방법입니다! 제가 표현한 '집단'이 군집이 되는 것이죠!
이 군집표본 추출법은 단순랜덤표본추출에 현실적인 제약이 있을 때 이용될 수 있으며, 개체에 대한 표본추출틀이 없어도 표본을 추출 할 수 있으며 실행할 수 있다는 장점을 갖습니다! 이러한 군집표본추출은 집단 내부는 이질적인 속성을 그리고 집단 간에는 동질적인 속성을 갖는 점이 층화표본 추출과는 상반됩니다~ 층화표본 추출에서는 같은 층에 속하면 동질적인 성질을 가지고 있으며, 다른 층에 속한 표본들은 이질적인 속성을 가지고 있었기 때문입니다!

 

군집표본 추출의 예시는 의견조사나 설문조사 등에서 자주 사용됩니다. 예를 들면 특정 시도에서 n개의 가구를 뽑아서 특정 제도에 대한 설문조사를 한다고 하면,  특정 시도에서 랜덤하게 구를 뽑은 다음, 뽑힌 구 안에서 동을 뽑고, 다시 뽑힌 동 안에서 반을 뽑은 다음, 뽑힌 반에 속하는 가구를 모두 다 조사하는 식으로 표본을 뽑는 방법을 고려할 수 있습니다! 이렇게 하면 가구 단위의 표본추출틀이 완전하지 않더라도 선택 편향을 막을 수 있고, 한 두 가구를 조사하기 위해 멀리 이동하는 어려움을 줄일 수 있습니다! 만일 똑같은 조사를 단순랜덤표본 추출법으로 뽑으면 한 가구를 조사하기 위해 먼 거리를 가야 할 수 있기 때문이죠~

 

이번 포스팅에서는 층화표본추출법과 군집표본추출에 대해 다뤄보았습니다!

다음 포스팅에서는 추출법의 마지막 내용인 계통 표본 추출법에 대해 이야기해보겠습니다~
긴 글 읽어주셔서 감사합니다!