본문 바로가기

공부/통계학

왜도, 첨도, 백분위수, 표준점수

안녕하세요! 눈꽃입니다~

지금까지 여러 번의 포스팅에 걸쳐서 자료를 요약하는 여러 방법에 대해서 다루어봤습니다!
범주형 자료와 양적 자료의 자료의 요약 방법을 각각 살펴보았으며, 직전 포스팅에서는 양적 자료의 요약 방법 중 하나로 산포도를 나타낼 수 있는 여러 척도들에 대해서 다루어보았습니다!

 

이번 포스팅에서는 자료에 대한 요약 방법 중 대푯값이나 산포도 다음으로 설명되는 왜도, 첨도, 백분위수 그리고 표준점수에 대해서 알아보도록 하겠습니다!

 

1. 왜도(skewness): 왜도는 비대칭의 정도를 나타냅니다! 공식은 다음과 같습니다~

위 공식에서 Sk는 왜도를 나타내며, 바 x는 표본 평균, s는 표본의 표준편차를 말합니다!

 

왜도가 양수이면 오른쪽으로 꼬리가 긴 함수가 되며, 왜도의 값이 음수이면 왼쪽으로 꼬리가 긴 분포가 됩니다!

 

그림으로 살펴보면, 아래와 같이 왼쪽으로 꼬리가 긴 분포는 왜도의 값이 음수라는 뜻이겠죠?

아래의 그림처럼 오른쪽으로 꼬리가 긴 분포라는 것은 왜도가 양수라는 뜻입니다!

 

2. 첨도(kurtosis): 첨도는 말 그대로 그래프가 얼마나 뽀족한 지를 나타내는 척도입니다! 첨도의 공식은 다음과 같습니다!

 

 

 

여기서 하나 알아두어야 하는 부분은 정규분포의 첨도는 3이라는 사실입니다!

정규분포의 첨도를 0으로 만들어주어, 정규분포의 첨도와 다른 그래프들의 첨도를 비교하기 쉽게 만들기 위해서 위 공식에서 3을 뺀 값을 첨도로 정의하는 경우도 많답니다!! 이렇게 원래의 첨도에서 3을 뺸 값을 초과 첨도(excess kurtosis)라고 합니다! 

첨도가 크면 큰 값을 가질 수록, 중앙이 뾰족한 형태를 가집니다!

 

 

3. 백분위수: 우리가 실생활에서 굉장히 많이 쓰는 백분위수는 특정 값이 다른 값들에 대해 상대적인 위치를 나타내 줄 때 사용하는데요, c 백분위수의 정의는 전체 관측값들의 c%가 그 값보다 작고, 나머지는 더 크다는 것을 의미합니다!
정의에 따르면 중위수는 50 백분위수에 해당하며, 더 큰 백분위수를 가질 수록 상위권에 있다는 것을 알 수 있습니다!

 

 

4. 표준점수: 표준점수란 관측값에서 평균을 뺀 값을 표준편차로 나눈 것을 의미합니다!  표준점수는 분자와 분모의 측정단위가 상쇄되기 때문에 측정 단위가 없는 수치가 되며, 표준점수들의 평균은 0, 표준편차는 1이 됩니다!

 

표준점수의 활용: 각 관측값의 위치가 평균을 중심으로 몇 표준편차 위 또는 아래에 있다는 것을 의미하므로 관측값의 전체 데이터 내에서의 위치를 잘 나타내줄 수 있습니다!
실제로, 표준점수는 수능처럼 난이도가 다른 과목을 치른 수험생들의 성적을 비교하여 표준점수를 산출할 때 활용되는 등, 생각보다 실생활에서 많이 사용이 됩니다!

 

예를 들어 어떤 학생이 국어 시험에서는 70점을 받고, 수학 시험에서는 80점을 받았다고 가정해봅시다. 국어시험 반 평균은 60점, 표준편차는 5점, 수학시험 반 평균은 70점이고 표준편차가 10점이었다면 국어의 표준점수는 2, 수학의 표준점수는 1로 수학시험을 '상대적으로' 더 잘 본 것이라고 판단할 수 있습니다!