공변량(Covariate) 상세 설명
공변량(covariate)은 종속변수(outcome)에 영향을 줄 수 있지만 연구의 주된 관심 대상은 아닌 독립변수입니다.
보통 분석의 정확도를 높이거나 혼란 변수(confounder)를 통제하기 위해 포함됩니다.
1. 공변량의 역할
| 목적 |
설명 |
| 혼란 통제 |
독립변수와 종속변수 모두에 영향을 미치는 변수들을 조정 |
| 정확도 향상 |
분산을 줄여서 추정 효율성 증가 |
| 보정 분석 |
계층별 차이를 보정하여 분석 |
2. 공변량의 종류
| 유형 |
설명 |
예시 |
| 연속형 |
숫자 형태, 연속적인 값 |
나이, 수입, 체중 |
| 범주형 |
몇 개의 명확한 범주 |
성별, 지역, 교육 수준 |
| 시간 의존 |
시간에 따라 변화 |
혈압, 혈당 등 시간별 측정값 |
3. 관련 개념
| 개념 |
설명 |
| 혼란 변수 (Confounder) |
독립변수와 종속변수 모두에 영향 |
| 조정 변수 |
분석에서 효과 추정을 위해 통제 |
| 중재 변수 |
영향 경로의 중간에서 작용 |
| 상호작용 변수 |
두 변수 조합에 따라 효과 변화 |
4. 분석에서 공변량의 처리
- 다변량 회귀 분석 (Multiple Regression)
- ANCOVA (공분산 분석)
- 성향 점수 매칭 (Propensity Score Matching)
- 층화 분석 (Stratification)
- 표준화 또는 보정 (Standardization/Adjustment)
5. 예시
예시: 어떤 약물의 효과를 평가하고자 할 때, 혈압이 종속변수이고 약물이 주요 독립변수라면,
나이, 체중, 성별 등은 공변량이 될 수 있습니다. 이 변수들은 혈압에 영향을 줄 수 있으므로 분석에서 통제해야 합니다.
6. 머신러닝에서의 공변량
머신러닝에서는 대부분의 입력 변수(features)가 공변량 역할을 합니다. 하지만 전통 통계 분석과 달리,
공변량과 주 효과 변수를 명확히 구분하지 않고 모델이 자동으로 중요도를 학습합니다.
7. 요약
| 항목 |
내용 |
| 정의 |
종속변수에 영향을 줄 수 있는 보조적 독립변수 |
| 목적 |
혼란 통제, 분석 정확도 향상 |
| 예시 |
나이, 성별, 지역, 체중 등 |
| 주의 |
무시하면 왜곡된 결과 발생 가능 |
0 댓글