🔹 1. 범주형 자료 (Categorical Data)
정의: 값이 숫자가 아닌 이름, 범주, 그룹 등으로 구분되는 자료
→ 데이터를 서로 다른 그룹으로 분류할 수 있지만, 그 사이에 수치적 계산은 의미 없음
✔ 특징
- 수량적 계산이 불가능
- 값 간의 순서나 크기 비교가 어려움 (명목형의 경우)
- 서로 다른 범주(Category)에 속함
✔ 종류
- 명목형(Nominal): 순서 없음 → 예: 성별, 혈액형
- 순서형(Ordinal): 순서 있음 → 예: 만족도, 등급
✔ 예시
- 성별: 남성, 여성
- 혈액형: A형, B형, O형, AB형
- 학점: A, B, C, D, F
- 설문 결과: 만족, 보통, 불만족
🔹 2. 연속형 자료 (Continuous Data)
정의: 특정 구간 내에서 무한히 많은 값을 가질 수 있는 수치형 자료
→ 수치 간의 비교, 연산, 평균 등이 가능
✔ 특징
- 수량적 계산 가능
- 값 사이의 간격과 비율 해석 가능
- 이론적으로는 무한한 소수 표현 가능
✔ 종류
- 이산형(Discrete): 셀 수 있는 정수 값 (예: 자녀 수)
- 연속형(Continuous): 무한히 나눌 수 있는 값 (예: 키, 체중)
✔ 예시
- 키: 172.4cm
- 체중: 65.8kg
- 시험 점수: 87점
- 수입: 3,400,000원
- 온도: 21.5℃
✅ 범주형 vs 연속형 자료 비교
| 구분 | 범주형 자료 | 연속형 자료 |
|---|---|---|
| 데이터 형태 | 명칭, 그룹, 등급 | 수치, 양 |
| 측정 단위 | 없음 (또는 불연속적) | 존재 (정밀 측정 가능) |
| 연산 가능성 | 합계, 평균 불가능 | 합계, 평균, 비율 가능 |
| 예시 | 성별, 혈액형, 만족도, 직업군 | 키, 몸무게, 수입, 시간, 점수 |
| 세부 유형 | 명목형, 순서형 | 이산형, 연속형 |
📌 실전 예시
| 변수 | 자료 유형 | 설명 |
|---|---|---|
| 성별 | 범주형 (명목형) | 남/여처럼 이름으로 분류됨 |
| 만족도 | 범주형 (순서형) | 순서는 있지만 간격은 불명확 |
| 키 | 연속형 | 수치로 측정되고 평균·비교 가능 |
| 자녀 수 | 이산형 | 정수로 셈 가능 (0, 1, 2명...) |
| 월급 | 연속형 | 수치형이며 비율·평균 등 계산 가능 |

0 댓글