[PSM] Caliper란?

PSM에서 캘리퍼란?

1. 성향 점수 매칭(PSM)이란?

성향 점수 매칭(Propensity Score Matching, PSM)은 처치군과 대조군 간의 비교를 위해 두 그룹의 공변량 특성을 비슷하게 맞추는 통계 기법입니다.



2. 성향 점수란?

성향 점수는 각 개체가 처치군에 속할 확률을 의미하며, 일반적으로 로지스틱 회귀를 사용해 공변량으로부터 계산됩니다.



3. 캘리퍼(caliper)의 정의

캘리퍼는 성향 점수 매칭 시 두 개체 간의 성향 점수 차이에 제한을 두는 허용 오차 범위입니다. 성향 점수 차이가 이 값을 넘으면 매칭하지 않습니다.



4. 왜 캘리퍼가 필요할까?

  • 성향 점수 차이가 큰 개체를 매칭하면 결과 해석에 편향이 생깁니다.
  • 캘리퍼는 매칭의 질을 보장하기 위한 장치입니다.


5. 캘리퍼 설정 방법

가장 일반적인 기준은 다음과 같습니다:

  • 캘리퍼 = 0.2 × 표준편차(SD) of the logit-transformed 성향 점수 (Rosenbaum & Rubin, 1985)


6. logit 변환이란?

성향 점수는 0~1 사이의 값이므로, 이를 정규 분포에 가깝게 만들기 위해 logit 변환을 사용합니다.

logit(p) = log(p / (1 - p))



7. 예시

ID 그룹 성향 점수 (e)
A 처치 0.45
B 대조 0.42
C 대조 0.60
D 대조 0.80

캘리퍼가 0.05일 경우, A(0.45)와 매칭 가능한 대조군은 B(0.42)뿐입니다.



8. 캘리퍼 설정의 효과

캘리퍼 값 효과 결과
너무 작음 매칭 안 되는 경우 증가 표본 손실
너무 큼 부적절한 매칭 허용 편향 위험


9. 요약

항목 설명
정의 성향 점수 차이의 허용 범위
목적 유사한 개체만 매칭하여 편향 줄이기
일반 기준 0.2 × logit(e)의 표준편차
주의사항 너무 작으면 매칭 안 되고, 너무 크면 질이 나쁨

0 댓글