본문 바로가기

공부/통계학

양적 자료의 연관: 산점도, 공분산, 상관계수 안녕하세요! 눈꽃입니다~ 이전 포스팅까지는 하나의 변수를 요약/정리하는 방법으로 그림과 수치의 척도 등을 다뤄보았습니다! 지금부터는 두 변수 사이의 관계를 이해하기 위한 수치의 척도를 살표보오고 하겠습니다! 두 변수 사이의 관계를 파악할 때는 두 가지를 중점적으로 파악하여야 합니다~ ① 관계의 방향 ② 관계의 정도 쉽게 풀어서 설명하자면, 다른 변수가 한 변수의 변화로 인해 어떤 방향으로, 얼마큼 변화하는지를 파악해야 한다는 말입니다! 먼저 양적 자료일 때 연관성을 알아보는 방법에 대해 살펴보겠습니다! 1. 산점도: 두 변수가 짝을 이루어 관측된 n개의 자료점이 주어졌을 때, 이들을 좌표평면에 해당하는 점을 찍어 표현한 그림을 산점도라고 합니다! 일반적으로 다음과 같은 형태를 보여줍니다! 산점도를 통해서.. 더보기
줄기-잎 그림, 히스토그램, 선도표, 상자그림 안녕하세요! 눈꽃입니다~ 지난 포스팅까지 자료의 대푯값, 산포도나 왜도, 첨도 등 자료를 나타낼 수 있는 여러 척도들에 대해서 다뤄보았습니다! 이번 포스팅부터는 자료의 시각화 방법에 대해서 다뤄보겠습니다! 자료나 관측치는 성격이나 특징이 매우 상이해 각 자료/관측치에 따라 알맞은 시각화 방법을 사용하는 것이 중요합니다! 양적 잘의 경우에는 그래프를 활용하는 방법으로 줄기-잎그림(stem-and-leaf plot), 상자 그림(box plot), 히스토그램(histogram), 선도표(line graph) 등이 있으며 범주형 자료보다 상대적으로 방법이 다양한 편입니다! 그래프를 통해서 전체적인 패턴이나 분포를 알아볼 수 있고, 그것에서 벗어난 극단적인 관측값(특이점)을 쉽게 찾아낼 수 있기 때문에 그래프를.. 더보기
자료의 산포_ 분산, 번위, 사분위범위, 변동계수가 무엇이며 어떻게 구할까요? 안녕하세요! 눈꽃입니다~ 지난 포스팅에서는 자료의 분포 모양에 따라서 산술평균과 중위수를 비교해보는 시간을 가졌습니다! 대칭인 분포와 대칭이 아닌 분포 중 꼬리가 오른쪽으로 긴 분포, 왼쪽으로 긴 분포에서의 중위수와 산술평균을 따져보았습니다! 2021.04.10 - [교육/통계학] - 대칭인 분포, 왼쪽 오른쪽으로 꼬리가 긴 평균과 중위수를 비교하면? 대칭인 분포, 왼쪽 오른쪽으로 꼬리가 긴 평균과 중위수를 비교하면? 안녕하세요! 눈꽃입니다~ 지난 포스팅에서는 양적 자료의 대푯값의 산정에 대해 알아보면서, 평균, 절사평균, 중위수, 최빈값을 알아보았습니다! 그때 평균은 특이값의 영향을 많이 받는다는 단 lucete1504.tistory.com 이번 포스팅에서는 자료의 산포에 대한 요약에 대해서 다뤄봅시다.. 더보기
왜도, 첨도, 백분위수, 표준점수 안녕하세요! 눈꽃입니다~ 지금까지 여러 번의 포스팅에 걸쳐서 자료를 요약하는 여러 방법에 대해서 다루어봤습니다! 범주형 자료와 양적 자료의 자료의 요약 방법을 각각 살펴보았으며, 직전 포스팅에서는 양적 자료의 요약 방법 중 하나로 산포도를 나타낼 수 있는 여러 척도들에 대해서 다루어보았습니다! 이번 포스팅에서는 자료에 대한 요약 방법 중 대푯값이나 산포도 다음으로 설명되는 왜도, 첨도, 백분위수 그리고 표준점수에 대해서 알아보도록 하겠습니다! 1. 왜도(skewness): 왜도는 비대칭의 정도를 나타냅니다! 공식은 다음과 같습니다~ 위 공식에서 Sk는 왜도를 나타내며, 바 x는 표본 평균, s는 표본의 표준편차를 말합니다! 왜도가 양수이면 오른쪽으로 꼬리가 긴 함수가 되며, 왜도의 값이 음수이면 왼쪽으로.. 더보기
대칭인 분포, 왼쪽 오른쪽으로 꼬리가 긴 평균과 중위수를 비교하면? 안녕하세요! 눈꽃입니다~ 지난 포스팅에서는 양적 자료의 대푯값의 산정에 대해 알아보면서, 평균, 절사평균, 중위수, 최빈값을 알아보았습니다! 그때 평균은 특이값의 영향을 많이 받는다는 단점이 있고, 그런경우(특이값이 존재하거나 자료의 분포가 특이한 경우) 중위수가 평균보다 합리적인 대푯값이 될 수 있다고 말씀드렸습니다! 그렇다면 중위수와 평균은 자료의 분포에 따라 어떤 차이를 갖게 되는지 궁금하실 수 있어 이번 포스팅을 준비해보았습니다~ 양적 자료의 대푯값(평균, 절사평균, 중위수, 최빈값)에 대해 궁금하신 내용이 있다면 아래의 글을 보고 오시는 것을 추천드립니다! 자세하게 설명해 놓았습니다~ 2021.04.10 - [교육/통계학] - 대푯값_ 평균, 중위수, 최빈값, 절사평균은 무엇이며 장단점, 예시는.. 더보기
대푯값_ 평균, 중위수, 최빈값, 절사평균은 무엇이며 장단점, 예시는 무엇인가요? 안녕하세요! 눈꽃입니다~ 지난 포스팅에서는 범주형 자료의 요약 방법으로, 도수분포표와 막대그래프, 파이 차트에 대해 배워보았는데요! 이번에는 양적 자료의 요약 방법에 대해 배워보겠습니다! 본격적으로 양적 자료의 요약방법 들어가기 전에, 범주형 자료의 요약 방법이 궁금하신 분은 다음 링크 타고 들어가시면 도움이 되실 거예요! 2021.04.10 - [교육/통계학] - 자료의 요약_ 도수분포표, 막대그래프, 파이 차트 어떻게 쉽게 그리나요? 자료의 요약_ 도수분포표, 막대 그래프, 파이차트 어떻게 쉽게 그리나요? 안녕하세요! 눈꽃입니다~ 지난 포스팅에서는 자료의 종류에 대해서 알아보았어요! 그래서 범주형 자료, 양적 자료를 큰 틀로 범주형 자료 내에서는 다시 명목형 변수, 순서형 변수를, 양적 자료 luce.. 더보기
자료의 요약_ 도수분포표, 막대 그래프, 파이차트 어떻게 쉽게 그리나요? 안녕하세요! 눈꽃입니다~ 지난 포스팅에서는 자료의 종류에 대해서 알아보았어요! 그래서 범주형 자료, 양적 자료를 큰 틀로 범주형 자료 내에서는 다시 명목형 변수, 순서형 변수를, 양적 자료 안에서는 연속형 자료와 이산형 자료나, 구간형 자료나 비율형 자료로 나누었습니다! 이 내용에 대해서 더 궁금하신 분은 다음 링크 타고 들어가시면 도움이 많이 되실꺼에요! 2021.04.09 - [교육/통계학] - 통계_범주형 자료, 양적 자료, 명목형 , 순서형, 연속형, 이산형, 구간형, 비율형 자료 통계_범주형 자료, 양적 자료, 명목형 , 순서형, 연속형, 이산형, 구간형, 비율형 자료 안녕하세요! 눈꽃입니다~ 이번 시간에는 통계의 원자재라고 볼 수 있는 '자료'에 대해서 알아봅시다! 첫 포스팅에서 자료는 관찰이.. 더보기
통계_범주형 자료, 양적 자료, 명목형 , 순서형, 연속형, 이산형, 구간형, 비율형 자료 안녕하세요! 눈꽃입니다~ 이번 시간에는 통계의 원자재라고 볼 수 있는 '자료'에 대해서 알아봅시다! 첫 포스팅에서 자료는 관찰이나 실험 등을 통해 구할 수 있고, 그렇게 얻어진 원시자료는 양적 축소를 통하여 자료의 특성이 의미 있게 표현됨으로써 필요한 정보를 제공할 수 있어야 합니다. 특히 자료의 양이 클 때에는 자료를 요약하지 않고 그 특성을 파악하는 것은 매우 어려운 일이라고 볼 수 있죠. 이러한 문제에 사용되는 방법으로는 '수치'를 사용하거나 '그래프'를 사용해서 자료를 가공하는 통계적 방법을 고려해 볼 수 있습니다~ 1. 자료의 종류 : 자료의 종류에 따라 활용할 때, 정리하고 요약하는 방법이 다르게 사용될 수 있습니다! 따라서 자료를 정리하기에 앞서 우리가 가진 자료의 종류의 명확한 구분이 필요.. 더보기