[통계] 아주 쉬운 통계학 2
[통계] 아주 쉬운 통계학 2
안녕하세요.
이번 글에서는 지난 아주 쉬운 통계학 1에 이어, 통계 분석에서 중요한 가설검정(Hypothesis Testing) 과 다양한 비교 방법에 대해 다루도록 하겠습니다.
1. 가설검정의 기본 개념
- 정의
p-value(유의확률)를 계산하여, 귀무가설을 기각할지 여부를 판단하는 절차입니다. - ‘p-value’ 란?
귀무가설이 참이라고 가정했을 때, 관측된 값 이상으로 극단적인 값이 나올 확률
→ 일반적으로 0.05 이하면 귀무가설 하에서 관측 결과가 나올 가능성이 낮다고 보고, 귀무가설을 기각. - 유의수준(α)
기각 여부의 판단 기준값으로, 과학계에서 보편적으로 α = 0.05를 사용.
| 표기 | 의미 |
|---|---|
| * | p < 0.05 |
| ** | p < 0.01 |
| *** | p < 0.001 |
| N.S. | 유의미하지 않음 (non-significant) |
2. 귀무가설과 대립가설
- 귀무가설 (Null Hypothesis; H0): 부정적인 명제, “효과가 없다” 또는 “차이가 없다”는 주장
- 대립가설 (Alternative Hypothesis; H1): 밝히고 싶은 명제, “효과가 있다” 또는 “차이가 있다”는 주장
예시: 신약 연구
- H0: 신약은 기존 치료제와 효과 차이가 없다. (효능이 없다)
- H1: 신약은 기존 치료제보다 효과가 있다.
3. 오류 유형
- 제1종 오류 (Type I Error): 귀무가설이 옳음에도 불구하고 기각 (α)
- 제2종 오류 (Type II Error): 대립가설이 옳음에도 불구하고 기각하지 않음 (β)
- 검정력 (Power): 1 - β, 실제 효과가 있을 때 이를 올바르게 발견할 확률 (보통 80%로 설정)
효과 크기 (Effect Size): 효과의 상대적 크기를 나타내는 지표
예) 두 평균 차이를 모집단 표준편차로 나눈 값 (Cohen’s d)
4. 데이터 유형과 검정 방법
가설검정 선택 시 고려 요소:
- 데이터 유형 (양적/질적)
- 양적 변수의 경우, 데이터가 어떤 분포를 취하고 있는지가 검정 방법을 선택할 때 중요.
- t검정과 같이 모집단이 정규 분포를 따른다는 가정을 둔 가설검정을 모수검정이라고 함.
- 모집단 분포가 특정 분포라 가정하기 어려운 경우에는 비모수검정을 사용.
정규성 검사는 어떻게?
- 1) Q-Q Plot 시각화
- 2) 샤피로-윌크 검정
- 3) 콜모고로프-스미르노프(K-S) 검정
- 표본 수
5. 평균값 비교
5.1 모수검정 (Parametric Test) — 정규성 가정 필요
- 일표본 t검정: 한 집단 평균과 특정 값 비교
- H0: 모집단의 평균은 μ = ○○이다.
- 이표본 t검정: 두 집단 평균 비교 (등분산 가정 필요)
- H0: 2개 집단의 평균값은 같다(평균값의 차이=0).
- 등분산이 아닐 경우 웰치 t검정 사용
등분산성 검사는 어떻게?
- 바틀렛 검정 및 레빈 검정
5.2 비모수검정 (Nonparametric Test) — 정규성 불필요
- 윌콕슨 순위합 검정(Wilcoxon rank sum test)
- 평균값 대신 각 데이터 값의 순위에 기반하여 검정 실시.
- HO: 2개 모집단의 위치가 같다.
- 맨-휘트니 U 검정
- 비교할 2개 집단의 분포 모양 자체가 같아야 함.
- 정규분포가 아니어도 괜찮지만 분산이 같아야 함.
- 플리그너-폴리셀로 검정 / 브루너-문첼 검정
- 2개 모집단의 분포 형태가 달라고 사용 가능
6. 3집단 이상 비교와 다중비교 문제
t검정을 반복하면 제1종 오류 증가 문제가 발생 → 다중비교 방법 필요
6.1 분산분석(ANOVA)
- H0: 모든 집단의 평균이 같다.
- H1: 적어도 한 쌍에는 차이가 있다.
- 방법:
- 1) 집단의 차이를 무시하고 모든 데이터를 이용해 전체 평균 도출
- 2) 각 집단의 평균 도출 > 전체 평균과의 차이 계산.
- 3) (평균적인 집단 간 변동) / (평균적인 집단 내 변동) 계산하여 F통계량 계산.
- 4) F분포를 통해 유의성 판정
- 5) 튜키 검정과 같은 사후 분석 진행
6.2 다중비교 방법
- 본페로니 교정
- α/k 사용 (보수적)
- 매우 간편하지만 검정력이 낮다는 단점
- 튜키 검정(Tukey’s test)
- 본페로니보다 검정력 높음
- 던넷 검정(Dunnet’s test)
- 대조군 비교에 특화
- 모든 쌍을 비교하는 튜키 검정보다 검정력이 향상
- 윌리엄스 검정(William’s test)
- 순위 비교 상황에서 유리
6.3 3집단 이상 비모수 검정
- 크러스컬-윌리스 검정(Kruskal-Wallis test)
- 스틸-드와스 검정(Steel-Dwass test)
- 스틸 검정(Steel test)
7. 비율 비교
7.1 이항검정(biomoninal test)
- 하나의 범주가 확률 P, 또 하나의 범주가 확률 1-P로 나타나는지를 조사하는 검정.
- 범주가 2개일 때만 이용 가능 (ex. HO: 동전의 앞면이 1/2, 뒷면이 1/2 확률로 나온다.)
7.2 카이제곱 검정
- 적합도 검정: 관측 데이터 vs 기대 분포 비교
- 독립성 검정: 범주형 변수 간 관계 분석
7.3 피셔의 정확검정
- 표본 수가 적을 때, 모든 경우의 확률을 계산 (초기하분포)
참고문헌
- 아베 마사토. 빅데이터 시대, 올바른 인사이트를 위한 통계 101 × 데이터 분석 = Statistics for Data. 안동현 옮김. 한국: 프리렉, 2022. ISBN 9788965403388.
그럼, 다음 포스팅에서는 양적 변수 사이의 관계에 관한 상관과 회귀를 공부해보도록 하겠습니다.
읽어주셔서 감사합니다 😊
Bonus : 실제 Kaggle 데이터를 활용하여 다양한 가설 검정을 해볼 수 있습니다. 직접 해보고 싶으시다면 👉 gist
This post is licensed under CC BY 4.0 by the author.