@ddukbbok_kang

하고 싶은 건 일단 해봅니다.

Study/통계

[통계 개념 정리 4] 1종 오류와 2종 오류

강떡볶 2023. 8. 28. 22:17

** 본 게시글은 아래 링크를 참고하여 학습을 위해 재정리한 것이며, 모든 저작권은 아래 사이트에 있습니다.

 

[개념 통계 19] 1종 오류와 2종 오류란 무엇인가
[손으로 푸는 통계] 25. 1종 오류 vs 2종 오류

 

1종 오류와 2종 오류에 대해 공부하기 전에, 아래 게시글을 먼저 참고하면 좋을 것 같다.

 

[통계 개념 정리 1] 귀무가설과 대립가설

** 본 게시글은 아래 링크를 참고하여 학습을 위해 재정리한 것이며, 모든 저작권은 아래 사이트에 있습니다. [개념 통계 18] 귀무가설과 대립가설이란 무엇인가? [손으로 푸는 통계] 21. 귀무가설

ddukbbok-kang.tistory.com

 

 


 

우리가 수집한 자료는 모집단에서 추출한 표본이기 때문에 항상 오류의 가능성이 존재하며, 어떤 의사 결정을 할 때에 이 오류를 최소화해야 한다. 이번 포스팅에서는 이러한 오류의 종류에 대해서 공부한 내용을 정리해보겠다.

 

 

1종 오류의 개념

 

    • 실제로 귀무가설(H0)이 참이어서 채택해야 함에도 불구하고, 오차에 의해서 이를 기각하는 오류( α오류, 유의수준과 동일)
    • 1종 오류가 발생할 확률은, 우리가 뽑은 표본의 평균이 아주 낮은 확률을 뚫고 기각역에서 뽑힐 확률임
      • 그런데 우리는 표본 평균이 기각역에 있다는 이유로 기각해서 오류가 발생한 것임
        참고) 채택역과 기각역
        채택역 : 귀무가설을 채택시키는 영역 / 기각역 : 귀무가설을 기각시키는 영역

출처 : https://dlearner.tistory.com/36

  • 즉, 1종 오류가 발생할 확률 = 기각역의 넓이 = 유의 수준 = α
  • 1종 오류가 발생하지 않을 확률(옳은 결정을 할 확률)은 1-α

 

 

 

2종 오류의 개념

 

  • 실제로 귀무가설(H0)이 거짓이어서 기각해야함에도 불구하고, 오차에 의해서 이를 채택하는 오류( β오류)
  • 어떤 사람이 모집단의 평균을 A라고 주장했으나 이는 거짓이고, 실제 모집단의 평균이 μ이니 상황을 가정해보자
  • 이 상황을 분포로 나타내면 다음과 같음(왼쪽은 표본의 분포, 오른쪽은 실제 데이터의 분포)

 

출처 :https://www.youtube.com/watch?v=B_dgdTilhr0

  • 기각역에 속할 확률은 빨간색의 넓이(α)
  • 귀무가설이 거짓인데 채택할 확률은 파란색의 넓이(β)
  • 즉, 2종 오류가 발생할 확률은 β임
  • 1종 오류와 2종 오류의 개념을 표로 정리하면 다음과 같음

 

 

 

 

1종 오류와 2종 오류의 트레이드오프

 

  • 1종 오류 α와 2종 오류 β는 서루 트레이드오프 관계임
  • 기각역을 작게 하면 1종 오류는 줄어들고 2종 오류는 늘어나며, 기각역을 넓게 하면 1종 오류는 늘어나고 2종 오류는 줄어듦