본문 바로가기
통계학

[Weekly] 한 줄 통계학 지식[1]

by IT돌이 2024. 7. 7.

* 앞서, 해당 내용은 모두 제가 공부를 하며 배운 것을 나누기 위한 article입니다. 

  틀린 부분이나 이해가 가지 않으시는 부분이 있다면 댓글을 달아주시면,

  최대한 빠른 기일 내에 정답을 찾아 수정 및 답변해드리도록 하겠습니다.

  감사합니다.

 

* 대질문(Qn.)과 그에 따른 설명으로 구성되어 있습니다.

   '-' 기호

   - 정의를 뜻합니다

      내용 중, 필요한 설명은 해당 내용 문단 밑에 넘버링 하여 써내려가는 방식입니다.

   '*'기호

   - 주석을 뜻합니다.

   'ex'

   - 예시를 나타냅니다.

    '+'

    - 추가설명을 나타냅니다. 보지 않으셔도 큰 상관은 없습니다.

 

* 하단부 출처 링크를 첨부해 두겠습니다.

 


 

Q1. 사분위수란?

- 사분위수(Quartile)는 데이터를 4등분한 것이다.

  통계의 변량을 도수 분포로 정리하였을 때 적은 것으로 부터 1/4, 1/2, 3/4 자리의 변량값이다.[출처 1 : 위키백과]

 

이 말을 이해하기 위해선 통계 분석의 과정과 통계의 변량, 도수분포에 대해 알아볼 필요성이 있습니다.

 

1. 통계 분석의 과정

통계 분석의 과정은 크게 1) 수집 2) 정제 3) 추정 4) 검정 4가지를 따릅니다.

쉽게 이야기 하여, 데이터를 수집하고 '유의미한 데이터만 정제' 후 가설을 세우고(추정) 그 가설이 맞는지(검정) 확인하는 과정입니다.

이 중 정제에 사용됩니다.

*이상치를 제거하기 위한 목적이지만, 이상치에 관해서는 아래에서 설명하도록 하겠습니다.

 

2. 통계의 변량

변량은 쉽게 말해, 여러가지 자료(ex_점수, 수량 등 연속변수나 이산변수)를 수량으로 나타낸 것입니다.

 

3. 도수 분포

도수 분포를 알기 위해선 도수에 대해 알아야합니다.

도수란 앞서 말한 '변량'의 개수를 나타내는 것입니다.

 

ex)

반 아이들의 키 데이터의 일부

160cm  : 14명

162cm  : 10명

164cm  : 5명

이  중 변량은 'cm', 도수는 '인원수' 를 나타냅니다.

 

그렇다면 사분위수가 의미하는 것을 종합해 보겠습니다.

 

통계분석의 과정에서, 수치값(변량)을 개수로 표시할 때(도수), 개수의 1/4, 2/4, 3/4에 위치한 자리의 수치값이다.

 

+)

Q1 : 1/4

Q2 : 2/4

Q3 : 3/4

에 위치한 값으로 쓰이며, 데이터 정제 중 이상치를 제거할 때 사용됩니다.

이상치란, 데이터에서 매우 크거나 작은 수치를 뜻합니다.

그 '매우 크거나 매우 작은' 을 구분하기 위한 기준으로 IQR이라는 것을 사용합니다.

IQR = Q3 - Q1

으로 구해집니다.

 

Q2. 기술 통계와 추론 통계의 차이

들어가기에 앞서 기술통계와 추론 통계의 정의에 먼저 이야기해 보겠습니다.

 

1. 기술 통계

-  측정이나 실험에서 수집한 자료(data)의 정리, 요약, 해석, 표현 등을 통해 자료의 특성을 규명하는 통계적 방법이다.

   [출처2 : 위키백과]

즉, 데이터를 받아 그것을 수치화 시키거나 요약하여 가공하는 것 입니다.

 

2. 추론 통계

- 모집단에 대한 어떤 미지의 양상을 알기 위해 통계학을 이용하여 추측하는 과정을 지칭한다.

  [출처3 : 위키백과]

앞서 말한 기술 통계를 통해 추론을 하기 위한 것입니다.

모집단을 알 방법이 없을 때, 표본집단을 이용하여 모집단을 알기 위한 방법입니다.

 

출처

1. https://ko.wikipedia.org/wiki/%EC%82%AC%EB%B6%84%EC%9C%84%EC%88%98

 

사분위수 - 위키백과, 우리 모두의 백과사전

위키백과, 우리 모두의 백과사전. 사분위수(Quartile)는 데이터를 4등분한 것이다. 통계의 변량을 도수 분포로 정리하였을 때 적은 것으로부터 1/4, 1/2, 3/4 자리의 변량값이다. 임의의 확률변수 축에

ko.wikipedia.org

2. https://ko.wikipedia.org/wiki/%EA%B8%B0%EC%88%A0%ED%86%B5%EA%B3%84%ED%95%99

 

기술통계학 - 위키백과, 우리 모두의 백과사전

위키백과, 우리 모두의 백과사전. 기술 통계학(記述 統計學, descriptive statistics) 또는 기술통계는 측정이나 실험에서 수집한 자료(data)의 정리, 요약, 해석, 표현 등을 통해 자료의 특성을 규명하는

ko.wikipedia.org

3. https://ko.wikipedia.org/wiki/%ED%86%B5%EA%B3%84%EC%A0%81_%EC%B6%94%EB%A1%A0

'통계학' 카테고리의 다른 글

[Weekly] 한 줄 통계학 지식[6]  (0) 2024.08.19
[Weekly] 한 줄 통계학 지식[5]  (0) 2024.08.12
[Weekly] 한 줄 통계학 지식[4]  (0) 2024.07.15
[Weekly] 한 줄 통계학 지식[3]  (0) 2024.07.07
[Weekly] 한 줄 통계학 지식[2]  (1) 2024.07.07