범주형 자료와 연속형 자료

범주형 자료와 연속형 자료

🔹 1. 범주형 자료 (Categorical Data)

정의: 값이 숫자가 아닌 이름, 범주, 그룹 등으로 구분되는 자료

→ 데이터를 서로 다른 그룹으로 분류할 수 있지만, 그 사이에 수치적 계산은 의미 없음

✔ 특징

  • 수량적 계산이 불가능
  • 값 간의 순서나 크기 비교가 어려움 (명목형의 경우)
  • 서로 다른 범주(Category)에 속함

✔ 종류

  • 명목형(Nominal): 순서 없음 → 예: 성별, 혈액형
  • 순서형(Ordinal): 순서 있음 → 예: 만족도, 등급

✔ 예시

  • 성별: 남성, 여성
  • 혈액형: A형, B형, O형, AB형
  • 학점: A, B, C, D, F
  • 설문 결과: 만족, 보통, 불만족


🔹 2. 연속형 자료 (Continuous Data)

정의: 특정 구간 내에서 무한히 많은 값을 가질 수 있는 수치형 자료

→ 수치 간의 비교, 연산, 평균 등이 가능

✔ 특징

  • 수량적 계산 가능
  • 값 사이의 간격과 비율 해석 가능
  • 이론적으로는 무한한 소수 표현 가능

✔ 종류

  • 이산형(Discrete): 셀 수 있는 정수 값 (예: 자녀 수)
  • 연속형(Continuous): 무한히 나눌 수 있는 값 (예: 키, 체중)

✔ 예시

  • 키: 172.4cm
  • 체중: 65.8kg
  • 시험 점수: 87점
  • 수입: 3,400,000원
  • 온도: 21.5℃


✅ 범주형 vs 연속형 자료 비교

구분 범주형 자료 연속형 자료
데이터 형태 명칭, 그룹, 등급 수치, 양
측정 단위 없음 (또는 불연속적) 존재 (정밀 측정 가능)
연산 가능성 합계, 평균 불가능 합계, 평균, 비율 가능
예시 성별, 혈액형, 만족도, 직업군 키, 몸무게, 수입, 시간, 점수
세부 유형 명목형, 순서형 이산형, 연속형

📌 실전 예시

변수 자료 유형 설명
성별 범주형 (명목형) 남/여처럼 이름으로 분류됨
만족도 범주형 (순서형) 순서는 있지만 간격은 불명확
연속형 수치로 측정되고 평균·비교 가능
자녀 수 이산형 정수로 셈 가능 (0, 1, 2명...)
월급 연속형 수치형이며 비율·평균 등 계산 가능

0 댓글