본문 바로가기
통계학

[Weekly] 한 줄 통계학 지식[2]

by IT돌이 2024. 7. 7.

 

* 앞서, 해당 내용은 모두 제가 공부를 하며 배운 것을 나누기 위한 article입니다. 

  틀린 부분이나 이해가 가지 않으시는 부분이 있다면 댓글을 달아주시면,

  최대한 빠른 기일 내에 정답을 찾아 수정 및 답변해드리도록 하겠습니다.

  감사합니다.

 

* 대질문(Qn.)과 그에 따른 설명으로 구성되어 있습니다.

   '-' 기호

   - 정의를 뜻합니다

      내용 중, 필요한 설명은 해당 내용 문단 밑에 넘버링 하여 써내려가는 방식입니다.

   '*'기호

   - 주석을 뜻합니다.

   'ex'

   - 예시를 나타냅니다.

    '+'

    - 추가설명을 나타냅니다. 보지 않으셔도 큰 상관은 없습니다.

 

* 하단부 출처 링크를 첨부해 두겠습니다.


Q1. 제 1종 오류와 2종오류란?

 

1종오류와 2종 오류를 알기위해선 귀무가설대립가설에 대해서 먼저 알 필요가 있습니다.

 

1. 귀무가설

- H0라고 사용되며 사용자가 검증하고자 하는 가설의 '반대'를 의미합니다

 

2. 대립가설

- H1이라고 사용되며 사용자가 검증하고자 하는 가설을 의미합니다.

 

귀무가설의 예시

ex) 

"흡연의 정도에 따라 폐암 발생률의 유의미한 변화가 있을 것이다." 라는 가설을 세우려고 합니다.

귀무가설은 "흡연의 정도에 따라 폐암 발생률의 변화가 없다." 입니다.

 

만약 귀무가설이 기각(틀림을 입증되는 것)된다면, 대립가설이 맞아 사용자가 검증한 것이 맞게 되겠지요

 

  [진실] 귀무가설이 옳음 [진실] 대립가설이 옳음
[판단] 귀무가설이 기각되지 않음 오류 없음 2종 오류(β)
[판단] 귀무가설이 기각 됨 1종 오류(α) 오류없음

 

판단과 진실에 따라 오류를 이렇게 표시할 수 있습니다.

 

귀무가설이 실제로 옳지만, 판단이 잘못되어 기각되었을 경우를 '제 1종 오류'

 

대립가설이 실제로 옳지만, 판단이 잘못되어 귀무가설이 기각되지 않을 경우를 '제 2종 오류' 라고 합니다.

 

다음 그림을 통해 1 종 오류와 2종 오류의 관계성에 대해 알아보겠습니다.

< 그림 1 >

 

사용자가 조절 가능한 것은 '임계값'이 일반적입니다.

 

임계값을 좌 우로 조정했을 때

- 좌측으로 갈 수록 α 값이 늘어난다. but β 값이 줄어든다.

- 우측으로 갈 수록 β 값이 늘어난다. but α 값이 줄어든다.

= 즉, α β 둘 중 하나의 값을 줄이는 선택을 필요로 한다.

 

1종 오류가 더 중대사항으로 판단합니다.

 

왜 그런 것일까요?

 

사용자가 세웠던 대립 가설의 귀무가설이 '참' 이어서, 그 상관관계를 따질 수 없음에도

대립가설이 '참'임을 전제로 생각하기 때문입니다. 

 

Q2. p값(p-value)란?

 

유의 확률(Probability-value)를 의미합니다.

 

앞서 말한, 귀무가설이 맞다는 전제 하에, 표본에서 실제로 관측된 통계치와 같거나 더 극단적인 통계치가

관측될 확률을 뜻합니다.

 

보통 유의수준(하단 <그래프2 참조>)과 비교하여 귀무가설을 기각하거나 기각하지 않는 지표로 사용됩니다.

 

유의수준은 검증하고자 하는 정도에 따라 크기가 달라집니다만, 보통 0.05를 기준으로 삼는 경우가 많습니다.

*여기서 0.05란, 5% 확률로 귀무가설이 실제로 옳음에도 기각할 정도를 나타내는 것입니다.

 

만약

 

1. 유의수준 > p-value 라면- 극단적인 통계치가 관측될 확률이 낮으니,

귀무가설은 기각됩니다.

 

2. 유의수준 < p-value 라면- 극단적인 통계치가 관측될 확률이 높으니,

귀무가설이 기각되지 않습니다.

 

< 그림2 >

'통계학' 카테고리의 다른 글

[Weekly] 한 줄 통계학 지식[6]  (0) 2024.08.19
[Weekly] 한 줄 통계학 지식[5]  (0) 2024.08.12
[Weekly] 한 줄 통계학 지식[4]  (0) 2024.07.15
[Weekly] 한 줄 통계학 지식[3]  (0) 2024.07.07
[Weekly] 한 줄 통계학 지식[1]  (0) 2024.07.07