반응형
- 표본 선택
- 점 추정
- 표본 분포의 소개
- x ̅ 에 대한 표본 분포
- p ̅에 대한 표본 분포
- 기타 표본 추출 방법
- 요소(element)는 자료가 수집되는 개체(entity)이다.
- 모집단(population)은 관심이 되는 모든 요소들의 집합이다.
- 표본(sample)은 모집단의 부분집합(subset)이다.
- 표본 모집단(sampled population)은 표본이 추출된 모집단 이다.
- 표본의 틀(frame)은 표본으로 추출될 요소들의 목록(list)이다.
- 표본을 뽑는 이유는 모집단에 대한 연구 문제의 대답을 위한 자료를 수집하기 위함이다.
- 표본의 결과는 단지 모집단 특성에 대한 추정치(estimates)을 제공한다.
- 그 이유는 꽤 단순한데, 표본이 오직 모집단의 부분만을 포함하고 있기 때문이다.
- 올바른(proper) 표본 추출 방법을 통해, 표본의 결과는 모집단 특성에 대하여 “좋은” 추정치를 제공할 수 있다.
표본 추출
- 유한 모집단으로부터의 표분 추출
유한 모집단은 보통 아래와 같이 정의 된다.
- 조직 구성원 명단
- 신용 카드 계좌 수
- 재고 목록의 상품 수
크기가 N인 유한한 모집단으로부터 크기가 n인 단순 무작위로 추출된 표본은 각각의 크기가 n으로 가능한 표본들 중에서 동일한 확률로 추출된 표본 하나를 뜻한다.
다음 표본을 추출하기 전에 추출된 표본의 요소를 다시 복원하는 것을 복원추출이라고 한다.
비복원 추출은 가장 자주 사용되는 절차이다.
규모가 큰 표본추출 프로젝트에서는 컴퓨터로 생성시킨 무작위 수를 표본 추출 과정을 자동화 하는데 이용한다.
- 무한 모집단으로부터의 표분 추출
- 종종 표본 추출을 할 때, 모집단의 모든 요소들의 목록을 얻기가 불가능 할 때가 있다.
- 그 결과로 모집단에 대한 표본 틀을 구성할 수 없게 된다.
- 따라서 무작위 수를 이용하여 표본을 추출하는 절차를 사용할 수 없다.
- 무한 모집단의 사례에서는 이러한 상황이 빈번히 발생한다.
- 모집단은 종종 진행 과정 중에 항목이 생성되며, 그곳에 생성되는 항목의 수는 무제한적인 경우가 많다.
- 무한 모집단에서, 진행 과정에 대한 몇 가지 사례를 들면, 아래와 같다
- 생산 라인에서 제조되는 제품들
- 은행에서 발생하는 거래
- 기술 지원 센터에 걸려오는 통화 수
- 상점에 들어오는 고객의 수
- 무한 모집단의 경우에는, 표본이 선택될 모집단에 대한 타당성있는 통계적 추론을 하기 위해서는 무작위 표본 추출을 사용해야 한다.
- 무한 모집단의 무작위 표본은 아래의 조건이 만족된 상태에서 선택된 표본이다.
- 선택된 각각의 요소들은 관심의 대상인 모집단으로부터 추출된다.
- 각 요소들은 서로 독립적으로 추출된다.
점 추정
- 점 추정은 통계적 추론의 한 형태이다.
- 점 추정에서는 모수의 추정치로서 사용될 표본 통계량 값을 계산하기 위해 표본의 자료를 사용한다.
- x ̅ 를 모집단 평균 m 에 대한 점 추정량이라고 한다.
- s 를 모집단 표준편차 s에 대한 점 추정량이라고 한다.
- p ̅ 는 모집단 비율 p에 대한 점 추정량이라고 한다.
표적 모집단 : 추론하기를 원하는 모집단
표본 모집단 : 실제로 표본이 추출된 모집단
표본이 모집단을 추론하기 위해 사용될 때 마다, 표적 모집단과 표본 모집단이 서로 얼마나 일치하는지 확인해야 한다.
x ̅ 에 대한 표본 분포

x ̅ 에 대한 표본 분포는 평균 x ̅의 가능한 모든 값들에 대한 확률 분포이다.

점 추정량의 기대 값이 모집단 모수와 같을 때, 점 추정량은 불편 되었다거나 편향되지 않았다고 한다.



중심 극한 정리

반응형
'study > Big data analysis' 카테고리의 다른 글
연속확률분포 (0) | 2020.10.18 |
---|---|
이산 확률분포 (0) | 2020.10.16 |
확률입문 (0) | 2020.10.16 |
기술통계량 - 수치적 척도 (0) | 2020.10.14 |
기술통계량 - 정량적 측정 : 위치척도와 변동성 척도 (0) | 2020.10.14 |