모집단과 표본


데이터 분석의 목적과 알고자 하는 대상

데이터 분석의 목적

  • 데이터 분석의 주된 목적
    • 대상의 요약
    • 대상에 대한 설명
    • 예측
  • 구체적인 데이터 분석 목적을 정하는 것이 중요
    • 실험 방법, 데이터 분석 방법이 달라짐

알고자 하는 대상

알고자 하는 대상을 명확히 하는 것이 중요함

모집단

모집단의 정의

  • 알고자 하는 대상 전체
  • 데이터 분석 시 분석 목적과 알고자 하는 대상에 기초하여 직접 모집단을 설정해야함
    • 실제로 데이터를 얻을 가능성이 없는 요소를 포함한 모집단은 부적절
      • 분석 결과의 일반화와도 관련된 요소

모집단 크기

  • 모집단에 포함된 요소의 수 : 모집단 크기

유한모집단

  • 모집단 중 한정된 요소만 포함한 것
  • 아무리 요소가 많아도 한정돼있으면 유한모집단
    • 너무 크면 시간과 비용이 많이 듬 -> 전수조사가 현실적이지 않음

무한모집단

  • 모집단 중 포함된 요소의 개수가 무한한 것
  • 전수조사는 원칙적으로 불가능

모집단의 성질

모집단의 성질

  • 모집단은 데이터 분석에서 알고자 하는 대상 전체를 가리킴
    • 모집단의 성질을 알 수 있다면 대상을 설명하거나 이해할 수 있음
    • 예측도 가능해짐

전수조사

  • 모집단의 성질을 아는 방법의 하나
  • 모집단에 포함된 모든 요소를 조사
  • 비용, 시간이 많이 소요됨 -> 비현실적
    • 무한모집단은 원칙적으로 전수조사가 불가능

표본조사

  • 추론통계 : 모집단의 일부를 분석하여 모집단 전체의 성질을 추정
    • 표본 : 조사하는 모집단의 일부
    • 표본추출 : 모집단에서 표본을 뽑는 것
    • 표본조사 : 표본을 이용해 모집단의 성질을 조사하는 것
    • 모집단의 성질을 100% 알 수 없음. 어느 정도 불확실성을 염두에 두고 평가

표본 크기

  • 표본크기 : 표본에 포함된 요소의 개수
    • 알파벳 n으로 나타냄
  • 샘플 수 : 표본의 개수
    • 표본크기와는 다른 개념

표본크기는 모집단의 성질을 추정할 때의 확실성이나 가설검정의 결과에도 영향을 끼침