분산분석 (ANOVA) 이란?


ANOVA (분산분석) 완전 정복

🔍 ANOVA (분산분석)란?

ANOVA는 Analysis of Variance의 약자로, 두 개 이상의 집단 간 평균 차이를 검정하는 통계 기법입니다.


📌 왜 ANOVA가 필요할까요?

두 집단 간 평균을 비교할 때는 t-검정이 적합하지만, 세 집단 이상을 비교하려면 ANOVA가 필요합니다. 여러 번의 t-검정을 수행하면 오류 확률이 누적되기 때문입니다.


📐 기본 개념

  • 귀무가설 (H₀): 모든 집단 평균이 같다.
  • 대립가설 (H₁): 적어도 하나의 집단 평균이 다르다.

⚙️ 원리

ANOVA는 변동을 두 가지로 분리하여 분석합니다:


분산 종류 의미 설명
집단 간 분산 처리 효과 집단 평균 간 차이
집단 내 분산 오차 같은 집단 내 개체 간 차이

F-통계량 계산: F = MSB / MSW (집단 간 평균제곱 / 집단 내 평균제곱)


🧪 ANOVA의 종류

  • 일원분산분석 (One-Way ANOVA): 한 가지 독립변수
  • 이원분산분석 (Two-Way ANOVA): 두 개 독립변수 (상호작용 포함 가능)
  • 반복측정 ANOVA: 같은 피험자에게 여러 처치 적용

🧠 가정

  1. 정규성: 데이터는 정규분포
  2. 등분산성: 각 집단의 분산이 동일
  3. 독립성: 각 데이터는 독립적으로 수집

🔍 사후분석 (Post-hoc test)

ANOVA가 유의하더라도 어떤 집단 간 차이가 있는지는 사후분석으로 확인해야 합니다. 예시: Tukey, Bonferroni


📊 간단 예시

그룹 점수
A65, 70, 68
B75, 78, 74
C85, 88, 90

✅ 요약

항목 설명
목적여러 집단의 평균 비교
통계량F-값
가정정규성, 등분산성, 독립성
사후분석쌍 비교 (Tukey 등)

📘 끝까지 읽어주셔서 감사합니다! 궁금한 점은 댓글로 남겨주세요 :)

0 댓글