✅ 로지스틱 회귀분석이란?
로지스틱 회귀분석은 종속변수가 이항(binary) 또는 다항(multinomial) 범주형일 때 사용되는 회귀분석 기법입니다.
✅ SAS에서의 로지스틱 회귀 Syntax
PROC LOGISTIC DATA=데이터셋이름;
CLASS 범주형변수들 (PARAM=REF REF='기준값') / PARAM=REF;
MODEL 종속변수(EVENT='1') = 독립변수1 독립변수2 ... / SELECTION=STEPWISE;
OUTPUT OUT=결과데이터셋이름 P=예측확률;
RUN;
✅ 주요 옵션 설명
| 옵션 | 설명 |
|---|---|
| DATA= | 사용할 데이터셋 이름 |
| CLASS | 범주형 독립변수 지정, 참조 범주 방식 사용 |
| REF='값' | 참조 범주 지정 |
| MODEL | 종속변수와 독립변수 설정 |
| EVENT='1' | ‘성공’으로 간주할 종속변수 값 지정 |
| SELECTION= | 변수 선택 방식 (STEPWISE, FORWARD 등) |
| OUTPUT | 예측값을 포함한 새로운 데이터셋 생성 |
| P= | 예측확률 저장 변수명 |
✅ 예시 코드
PROC LOGISTIC DATA=mydata;
CLASS gender(ref='Female') region(ref='North') / PARAM=REF;
MODEL purchase(event='1') = age income gender region / SELECTION=STEPWISE;
OUTPUT OUT=predicted P=probability;
RUN;
purchase: 구매 여부gender,region: 범주형 변수probability: 예측 확률 저장 변수
🧾 결과 해석 팁
- Parameter Estimates: 독립변수의 영향력 해석
- Odds Ratio Estimates: 변수 변화에 따른 승산비
- Model Fit: AIC, -2 Log L 등을 통해 모형 평가

0 댓글