Random variable(확률 변수)의 정의와 종류, 예시까지 / Random Process #2

확률 변수(random variable)의 정의를 위해서 공리(axiom)을 통한 확률의 정의에 필요한 다양한 개념들이 사용된다. 쉬운 개념은 아니기 때문에 정의가 이해되지 않는다면 사례들을 통해서 이해해 보아도 좋을 것 같다.

Random Variable

확률 변수는 함수이다. 확률 변수의 정의역은 샘플(sample)을 원소로 가지는 샘플 공간(sample space) \Omega 이고 확률 공간(probability space) (\Omega, ~ \mathcal{A}, ~ P) 에 대해서 가측(measurable)하다. 또한, 공역은 실수 \mathbb{R} 이고 Borel measurable space (\mathbb{R}, ~ \mathcal{B}) 에 대해서 가측하다. 아래와 같이 수식으로 표현할 수 있다.

X: ~ \Omega\rightarrow\mathbb{R} ~ \text{such that} ~ \forall B\in\mathcal{B}, X^{-1}(B)\in\mathcal{A}

풀어서 설명하면, 확률 변수 X 는 sample을 실수에 대응시키는 함수이다. \mathcal{B} 의 원소인 B 는 간단히 실수의 부분집합이고, B 의 inverse image를 구하면 \mathcal{A} 의 원소가 된다고 한다. 샘플 공간 \Omega 의 부분집합을 사건이라고 하고, \mathcal{A}는 모든 사건의 집합이므로 \Omega 의 모든 부분집합의 집합이라고 정리된다.

즉, 실수 집합을 확률 변수을 통해서 inverse image를 구하면 사건이 나온다는 얘기이다.

Random Variable 사례

random variable
출처: cambridgemaths.org

예시를 한 번 들어보자. 동전을 3번을 던져서 ‘앞면(H; head)’ 혹은 ‘뒷면(T; tail)’이 나오는 사건을 정리하면 총 8개이다.
‘HHH’, ‘HHT’, ‘HTH’, ‘THH’, ‘HTT’, ‘THT’, ‘TTH’, ‘TTT’의 8개의 샘플이 샘플 공간의 원소가 된다. 샘플들을 실수에 대응시키는 함수가 바로 확률 변수 X 이다.

예를 들어, X 를 ‘앞면이 나온 동전의 개수’라고 해보자. 그러면 아래와 같이 샘플들을 실수에 매치시킬 수가 있다.

X(HHH)=3, ~ X(HHT)=2, ~ X(HTH)=2, ~ X(THH)=2, \\ X(HTT)=1, ~ X(THT)=1, ~ X(TTH)=1, ~ X(TTT)=0

이 때, 실수집합 B 를 {2, 3}라고 한다면, X^{-1}(B) \{HHH, HHT, HTH, THH \} 가 될 것이고, \mathcal{A} 의 원소이다.

Random variable과 확률

Sample space의 원소 sample들의 중요한 성질 중 하나가 확률을 가지고 있다는 것이다. 위의 예시를 생각해보면 sample HHH는 나올 확률이 1/8이다. 따라서 P({HHH})=1/8 라고 표기할 수 있다. 그렇다면 확률 변수 X 의 inverse image를 바탕으로 확률을 표기할 수는 없을까? {HHH} X^{-1}(3) 이라고 표현할 수 있다. 이를 바탕으로 아래와 같이 새로운 기호를 정의하자.

P(X\in B):=P(X^{-1}(B))=P(\{\omega:X(\omega)\in B\})

예제

Sample space와 \mathcal{A} 를 각각 \{1, ~ 2, ~ 3, ~ 4, ~ 5, ~ 6\} 2^{\Omega}라고 할 때, 확률 변수 X 를 다음과 같이 정의하자. 이 때, P(X\leq 10) 를 어떻게 표현할 수 있을까?

\omega\in\Omega123456
r\in\mathbb{R}10-1020-1030-10

r 이 10보다 같거나 작은 \omega 는 1, 2, 4, 6이 되기 때문에, P(X\leq 10)=P(\{1, ~ 2, ~ 4, ~ 6\})가 된다.

Random variable의 종류

확률 변수는 크게 2개로 분류할 수 있습니다. 바로 “연속 확률 변수(continuous random variable)”와 “이산 확률 변수(discrete random variable)”입니다. 둘은 값의 가능성에 차이가 있습니다.

Continuous random variable(연속 확률 변수)

연속 확률 변수 X 를 통한 확률 (P(X\in B)) 은 다음과 같이 정의된다.

P(X\in B)=\int_{B}f(t)dt:=\int_{-\infty}^{\infty}I_{B}(t)f(t)dt

예시. 키

대한민국 남성의 키라는 샘플에 대해서 확률 변수를 항등 함수로 정의하자. 이 확률 변수는 연속 확률 변수가 된다. P(170\leq X \leq175) 는 대한민국 남성의 키가 170 이상 175 이하일 확률을 나타낸다. 대한민국 남성의 키가 170cm일 확률 (P(X=170)) 은 무엇일까? 키가 170cm일 확률은 0이다. 위의 정의에 따라서 식을 계산해보면 f(x) 에 상관없이 확률이 0이 된다.

Discrete random variable(이산 확률 변수)

이산 확률 변수 X 를 통한 확률 (P(X\in B)) 은 다음과 같이 정의된다.

P(X\in B)=\sum_{i:x_i\in B}P(X=x_{i})

예시. 주사위

주사위를 순서대로 두 번 굴리면 주사위 눈의 경우의 수는 총 36이다. 이산 확률 변수를 두 주사위 눈의 합으로 정의하자. 아래의 표와 같이 확률 변수를 확인할 수 있다.

123456
1(1, 1) → 2(1, 2) → 3(1, 3) → 4(1, 4) → 5(1, 5) → 6(1, 6) → 7
2(2, 1) → 3(2, 2) → 4(2, 3) → 5(2, 4) → 6(2, 5) → 7(2, 6) → 8
3(3, 1) → 4(3, 2) → 5(3, 3) → 6(3, 4) → 7(3, 5) → 8(3, 6) → 9
4(4, 1) → 5(4, 2) → 6(4, 3) → 7(4, 4) → 8(4, 5) → 9(4, 6) → 10
5(5, 1) → 6(5, 2) → 7(5, 3) → 8(5, 4) → 9(5, 5) → 10(5, 6) → 11
6(6, 1) → 7(6, 2) → 8(6, 3) → 9(6, 4) → 10(6, 5) → 11(6, 6) → 12

두 주사위 눈의 합이 7이 될 확률은 P(X=7) 로 표현할 수 있고, 이 확률은 6/36=1/6라는 것을 위의 표를 통해서 알 수 있다.

정리

확률 변수의 정의를 알아보았다. 확률 변수는 연속 확률 변수와 이산 확률 변수가 있고, 각각의 예시를 알아보았다.

Leave a Comment

Index