SAS에서는 PROC FREQ 절차를 사용하여 범주형 변수 간의 관련성을 분석할 수 있습니다. 이때 / CHISQ 옵션을 활용하면 카이제곱 검정을 수행할 수 있습니다.
📌 기본 문법
proc freq data=데이터셋명;
tables 변수1*변수2 / chisq;
run;
🔍 예시 코드
proc freq data=survey;
tables gender*buy / chisq;
run;
survey: 데이터셋 이름gender: 독립 변수 (범주형)buy: 종속 변수 (범주형)chisq: 카이제곱 검정을 실행하는 옵션
📈 출력 결과 해석
결과표에서 확인해야 할 주요 항목은 다음과 같습니다:
| Statistic | Value | DF | p-value |
|---|---|---|---|
| Pearson Chi-Square | 5.123 | 1 | 0.0237 |
- Chi-Square 값: 검정 통계량
- DF (자유도): (행 수 - 1) × (열 수 - 1)
- p-value: 보통 0.05보다 작으면 두 변수 간에 유의한 관련성이 있다고 판단
📌 기대빈도 출력 추가
proc freq data=survey;
tables gender*buy / chisq expected;
run;
expected 옵션을 추가하면 기대빈도표도 함께 출력됩니다.
📌 기대빈도가 작을 때: Fisher의 정확 검정
proc freq data=survey;
tables gender*buy / chisq fisher;
run;
fisher 옵션은 빈도수가 적은 경우에 보다 정확한 검정을 수행합니다.
✅ 요약
| 목적 | SAS 코드 |
|---|---|
| 카이제곱 검정 | / chisq |
| 기대빈도 출력 | / chisq expected |
| 피셔의 정확 검정 | / chisq fisher |
SAS의 PROC FREQ는 카이제곱 검정을 매우 간편하게 수행할 수 있는 도구입니다. 범주형 변수 간의 독립성을 검정하고자 할 때 매우 유용하게 활용됩니다.

0 댓글