1. 성향 점수 매칭(PSM)이란?
성향 점수 매칭(Propensity Score Matching, PSM)은 처치군과 대조군 간의 비교를 위해 두 그룹의 공변량 특성을 비슷하게 맞추는 통계 기법입니다.
2. 성향 점수란?
성향 점수는 각 개체가 처치군에 속할 확률을 의미하며, 일반적으로 로지스틱 회귀를 사용해 공변량으로부터 계산됩니다.
3. 캘리퍼(caliper)의 정의
캘리퍼는 성향 점수 매칭 시 두 개체 간의 성향 점수 차이에 제한을 두는 허용 오차 범위입니다. 성향 점수 차이가 이 값을 넘으면 매칭하지 않습니다.
4. 왜 캘리퍼가 필요할까?
- 성향 점수 차이가 큰 개체를 매칭하면 결과 해석에 편향이 생깁니다.
- 캘리퍼는 매칭의 질을 보장하기 위한 장치입니다.
5. 캘리퍼 설정 방법
가장 일반적인 기준은 다음과 같습니다:
- 캘리퍼 = 0.2 × 표준편차(SD) of the logit-transformed 성향 점수 (Rosenbaum & Rubin, 1985)
6. logit 변환이란?
성향 점수는 0~1 사이의 값이므로, 이를 정규 분포에 가깝게 만들기 위해 logit 변환을 사용합니다.
logit(p) = log(p / (1 - p))
7. 예시
| ID | 그룹 | 성향 점수 (e) |
|---|---|---|
| A | 처치 | 0.45 |
| B | 대조 | 0.42 |
| C | 대조 | 0.60 |
| D | 대조 | 0.80 |
캘리퍼가 0.05일 경우, A(0.45)와 매칭 가능한 대조군은 B(0.42)뿐입니다.
8. 캘리퍼 설정의 효과
| 캘리퍼 값 | 효과 | 결과 |
|---|---|---|
| 너무 작음 | 매칭 안 되는 경우 증가 | 표본 손실 |
| 너무 큼 | 부적절한 매칭 허용 | 편향 위험 |
9. 요약
| 항목 | 설명 |
|---|---|
| 정의 | 성향 점수 차이의 허용 범위 |
| 목적 | 유사한 개체만 매칭하여 편향 줄이기 |
| 일반 기준 | 0.2 × logit(e)의 표준편차 |
| 주의사항 | 너무 작으면 매칭 안 되고, 너무 크면 질이 나쁨 |

0 댓글