반응형
- 균일확률분포
- 정규확률분포
- 지수확률분포
- 연속확률변수는 연속된 어떤 한 구간이나 여러 구간들의 집합에 내의 값을 취할 수 있다.
- 확률변수가 특정한 단일 값을 가질 확률에 대하여 언급할 수 없다.
- 대신, 확률변수의 특정 값이 주어진 구간에 속할 확률에 대하여는 말할 수 있다.
- 주어진 x1에서 x2까지 구간에서 취할 수 있는 확률변수의 확률은 확률 밀도 함수의 x1에서 x2까지 구간에서 그래프아래부분의 면적이다.
균일 확률 분포
- 확률이 구간의 길이에 비례하면, 확률변수는 균일하게 분포된다.
- 균일 확률 밀도함수는 아래와 같다.
정규확률분포
- 정규확률분포는 연속확률변수를 기술하는 가장 중요한 분포이다.
- 통계적 추론에 폭넓게 사용된다.
- 분포가 대칭적이다. 즉, 왜도 값은 0
- 모든 종류의 정규 확률 분포는 모수(평균과 표준편차)로 그 모양이 결정된다.
- 정규 곡선은 평균에서 가장 높다. 그리고 그곳이 중앙값이고 최빈값이 된다.
- 평균은 어떤 수치라도 될 수 있다. 음수, 0 , 양수
- 표준편차가 커질수록 모양은 넓어지고 평평해 진다.
경험의 법칙
표준 정규 확률 분포
- 평균이 0이고 표준편차가 1인 정규분포를 따르는 확률 변수는 표준 정규 확률 분포를 따른다고 한다.
- 문자 z는 표준 정규 확률 변수를 나타낼 때 사용한다.
표준정규분포로 전환 (표준화)
z = (x - 평균)/표준편차
엑셀을 사용한 표준 정규 확률 계산
- NORM.S.DIST 는 주어진 z 값에 대한 누적확률을 계산하는데 사용
- NORM.S.INV 는 주어진 누적 확률에 해당하는 z값을 계산 하는데 사용
- S가 표준 정규 분포와 연관이 있음을 상기 시켜준다.
- NORM.DIST 는 주어진 x값에 대한 누적 확률을 계산하는 데 사용
- NORM.INV는 주어진 누적 확률에 해당하는 x값을 계산하는데 사용
지수 확률 분포
- 지수 확률 분포표는 어떤 작업을 완성하는 데 걸리는 시간을 기술하는데 유용함.
- 대기 행렬 적용 문제와 관련하여, 지수 분포는 서비스 시간의 문제를 푸는데 주로 사용된다.
- 지수 분포의 속성 중 하나는 평균과 표준편차가 같다는 것이다.
- 또한 지수 분포는 오른쪽 꼬리가 길다. 분포에 대한 왜도 값은 2이다.
- 지수 확률 변수는 아래와 같은 경우를 기술하는데 사용될 수 있다.
- 주차 요금소에 도착하는 차량들의 시간 간격
- 한 설문지를 완성하는 데 걸리는 시간
- 고속도로에서 파손 지점 간의 거리
ex) 알의 풀서비스 주유소
: 주유소에 도착하는 자동차들의 시간 간격은 평균 3분인 지수 확률 분포를 따른다.
알은 연이은 두차 시간 간격이 2분 이하인 확률을 알고싶어한다.
포아송과 지수 분포와의 관계
- 포아송 분포는 구간 당 사건 발생 횟수에 대한 타장한 설명을 제시
- 지수 분포는 사건 발생 간 구간의 길이에 대한 타당한 설명을 제시
반응형
'study > Big data analysis' 카테고리의 다른 글
표본 추출과 표본 분포 (0) | 2020.10.18 |
---|---|
이산 확률분포 (0) | 2020.10.16 |
확률입문 (0) | 2020.10.16 |
기술통계량 - 수치적 척도 (0) | 2020.10.14 |
기술통계량 - 정량적 측정 : 위치척도와 변동성 척도 (0) | 2020.10.14 |