Basic Statistics

확률변수

루크안 2020. 1. 21. 22:49
반응형

확률변수(random varaible)

표본공간 내의 각 사건들에 실수 값을 대응시키는 함수를 의미하며, 간단하게 표현하면 사상(event)들을 수치적인 표현으로 바꾼 것이 확률변수이다. 이와 같은 확률변수는 실험의 결과가 숫자로 나오는 경우이거나 숫자로 표현하기 곤란한 질적 자료의 형태로 나오는 경우에도 확률을 표현하는데 유영하게 사용되어 질 수 있다.

예를 들어 동전을 세 번 던지는 실험을 생각해 보면, 실험의 가능한 결과들의 모임인 표본공간 S는 다음과 같다.

S = {(T,T,T), (H,T,T), (T,H,T), … , (H,T,H), (T,H,H), (H,H,H)} #H는 앞면, T는 뒷면

이 실험에서 앞면이 2번 나오는 사건의 확률을 표현하려면 P{(H,H,T), (H,T,H), (T,H,H)}의 형태가 된다. 이 실험의 결과에 앞면의 수를 대응시키는 함수를 X라 정의하면, 앞의 확률 표현은 간단히 P(X=2)로 표현할 수 있다. 즉, 이 때 X가 확률변수가 된다. X는 0,1,2,3을 취할 수 있다.

*셀 수 있는 이산적인 값을 취하면 이산형 확률변수 (예) 주사위를 던질 때 나오는 눈의 수

*연속적인 실수 값을 취하면 연속형 확률변수 (예) 어느 회사 사원들 키

 

 

확률밀도함수(probability density function, PDF)

→ 어떤 함수 f(x)가 다음과 같은 조건을 만족하면 f(x)는 확률변수 X의 확률밀도함수가 된다, 또한, f(x)가 확률밀도함수라면 다음과 같은 조건을 반드시 만족해야 한다.

 

→ 모든 x에 대하여 non negative이다.

→ 확률밀도함수 아래의 전체 면적은 1이다.

→ 확률변수 X가 a와 b사이 즉, 구간(a,b)에 있을 확률은 해당 구간에서 확률밀도함수의 아래 부분의 면적과 같다.

 

연속형 확률변수의 기댓값과 분산

→ 연속형 확률변수 X의 확률밀도함수가 f(x)일 때, X의 기댓값과 분산은 이산형 확률변수의 경우에서 합이 적분으로 바뀌어 다음과 같이 계산되어 진다.

 

반응형