[로지스틱 회귀분석] SAS Syntax


SAS 로지스틱 회귀분석 Syntax 설명

✅ 로지스틱 회귀분석이란?

로지스틱 회귀분석은 종속변수가 이항(binary) 또는 다항(multinomial) 범주형일 때 사용되는 회귀분석 기법입니다.



✅ SAS에서의 로지스틱 회귀 Syntax

PROC LOGISTIC DATA=데이터셋이름;
   CLASS 범주형변수들 (PARAM=REF REF='기준값') / PARAM=REF;
   MODEL 종속변수(EVENT='1') = 독립변수1 독립변수2 ... / SELECTION=STEPWISE;
   OUTPUT OUT=결과데이터셋이름 P=예측확률;
RUN;


✅ 주요 옵션 설명

옵션설명
DATA=사용할 데이터셋 이름
CLASS범주형 독립변수 지정, 참조 범주 방식 사용
REF='값'참조 범주 지정
MODEL종속변수와 독립변수 설정
EVENT='1'‘성공’으로 간주할 종속변수 값 지정
SELECTION=변수 선택 방식 (STEPWISE, FORWARD 등)
OUTPUT예측값을 포함한 새로운 데이터셋 생성
P=예측확률 저장 변수명


✅ 예시 코드

PROC LOGISTIC DATA=mydata;
   CLASS gender(ref='Female') region(ref='North') / PARAM=REF;
   MODEL purchase(event='1') = age income gender region / SELECTION=STEPWISE;
   OUTPUT OUT=predicted P=probability;
RUN;
  • purchase: 구매 여부
  • gender, region: 범주형 변수
  • probability: 예측 확률 저장 변수


🧾 결과 해석 팁

  • Parameter Estimates: 독립변수의 영향력 해석
  • Odds Ratio Estimates: 변수 변화에 따른 승산비
  • Model Fit: AIC, -2 Log L 등을 통해 모형 평가

0 댓글