본문 바로가기

공부/통계학

줄기-잎 그림, 히스토그램, 선도표, 상자그림

안녕하세요! 눈꽃입니다~
지난 포스팅까지 자료의 대푯값, 산포도나 왜도, 첨도 등 자료를 나타낼 수 있는 여러 척도들에 대해서 다뤄보았습니다!

 

이번 포스팅부터는 자료의 시각화 방법에 대해서 다뤄보겠습니다!

자료나 관측치는 성격이나 특징이 매우 상이해 각 자료/관측치에 따라 알맞은 시각화 방법을 사용하는 것이 중요합니다!

 

양적 잘의 경우에는 그래프를 활용하는 방법으로 줄기-잎그림(stem-and-leaf plot), 상자 그림(box plot), 히스토그램(histogram), 선도표(line graph) 등이 있으며 범주형 자료보다 상대적으로 방법이 다양한 편입니다!

그래프를 통해서 전체적인 패턴이나 분포를 알아볼 수 있고, 그것에서 벗어난 극단적인 관측값(특이점)을 쉽게 찾아낼 수 있기 때문에 그래프를 그리는 것을 굉장히 중요합니다!

 

 1. 줄기-잎 그림(stem-and-leaf plot)

(1) 장점: 줄기-잎 그림은 실제 자료의 수치를 그대로 활용하면서 분포의 형태를 보여주는 장점이 있습니다! 또한 쉽고 빠르게 그릴 수 있으며, 정보나 자료의 손실이 없습니다(실제 자료의 수치를 활용하므로)

(2) 활용: 모든 값이 양수이면서 자료의 양이 많지 않은 경우에 효율적입니다!(물론 음수일 때도 활용할 수 있긴 합니다!)

(3) 특징: 두 개의 연관된 분포를 비교할 때, 등맞댄 줄기-잎 그림(back-to-back stemplot)을 활용하기도 합니다!

(4) 그리는 방법: ① 가장 오른쪽의 숫자(대부분 일의 자리 숫자)를 잎으로 한다.

나머지는 모두 줄기로 삼는다

③ 줄기를 아래로 순서대로 나열하고, 세로의 줄을 그은 후 줄기 옆에 잎을 하나씩 쓴다

④ 잎을 오름차순으로 정렬한다.

등맞댄 줄기 잎 그림은 다음과 같습니다!

2. 히스토그램

:히스토그램의 높이는 자료의 빈도를 의미합니다! 즉 히스토그램의 높이가 높다는 것은 그 자료의 상대 빈도가 높다는 것을 의미하죠!

(2) 히스토그램은 실제 자료의 수치를 그대로 활용하는 것은 아니라 정보의 손실이 발생하긴 하지만, 큰 자료를 요약하는 데에는 더욱 유리하다는 특징을 가지고 있습니다!

(3) 히스토그램의 모든 막대의 넓이의 합은 1이 되어야 합니다!

따라서 (막대의 높이)=(구간에 속하는 자료의 상대 빈도)/(구간의 길이)로 구할 수 있습니다!

3. 선도표(시계열 그래프)

:선도표는 자료가 시간에 따라 측정된 자료(시계열 자료) 일 때 사용하는 그래프입니다!

가로축을 시간으로 하여 시계열 그래프를 그리면 추세나 계절 변동 등을 한눈에 파악할 수 있게 됩니다!

4. 상자 그림

: 상자 그림은 다섯 숫자 요약을 그래프를 통해 시각화한 것입니다!

(1) 단순 상자 그림(simple boxplot): 모든 자료를 포함하여 상자 그림을 그리는 것 (위 자료처럼 그리시면 됩니다!)

(2) 수정 상자 그림(modified boxplot): 특이점을 표현해주는 상자그림

   특이점은 1.5 IQR을 기준으로 판단합니다! Q3+1.5 IQR보다 크거나 Q1-1.5 IQR보다 작은 경우를 특이점이라고 판단합니다!

수정 상자 그림의 상자 부분은 단순 상자 그림과 같이 중앙값을 포함하여 그려주되, 특이점으로 판단되는 값들은 *나. 등 다양한 기호들로 대체하여 표현합니다! 

이때 Q1, Q2, Q3은 상황에 따라 다르지만 대부분 특이점을 포함하여 산출합니다!

 

(다섯 숫자 요약이나 Q1, Q2, Q3, IQR에 대해서 헷갈리시는 분은 다음 링크 따라 들어가시면 될 것 같습니다! )

lucete1504.tistory.com/20

 

자료의 산포_ 분산, 번위, 사분위범위, 변동계수가 무엇이며 어떻게 구할까요?

안녕하세요! 눈꽃입니다~ 지난 포스팅에서는 자료의 분포 모양에 따라서 산술평균과 중위수를 비교해보는 시간을 가졌습니다! 대칭인 분포와 대칭이 아닌 분포 중 꼬리가 오른쪽으로 긴 분포,

lucete1504.tistory.com

(3) 특징: 상자 그림은 여러 개의 분포를 한눈에 비교할 때 유용하게 활용됩니다!