확률 및 랜덤변수 (4), 이산랜덤변수

2022. 4. 15. 00:46강의 내용 정리/확률및랜덤변수

728x90
반응형

이산랜덤변수

1. 랜덤변수의 개념

1) 랜덤변수란?

(1) 예측할 수 없는 값을 가지는 변수이다.

(2) 어떤 값이 확률적으로 정의될 때를 의미한다.

(3) 랜덤 실험 결과에 의해 값이 결정된다.

(4) 표본 공간에 있는 실험 결과를 실수값으로 대응시키는 함수로 이는 수학에서의 정의이다.

예시) 내일 삼성 주가, 이번학기 학점 등등

 

- 랜덤 변수는 보통 bold체로 굵게 표현한다.

- 랜덤 변수가 가질 수 있는 모든 가능한 집합은 치역이다.

 

 

예제 1

동전의 앞면이 나오는 것을 랜덤변수 x로 정의해 정상 동전을 2회 던져서 앞면과 뒷면이 나오는 것을 관찰하기


- sample space에 있는 사건을 실수값에 대응시키기에 랜덤변수는 함수인 것을 알 수 있다.

 


2) 이산 랜덤변수란?

- 랜덤변수 x가 셀 수 있는 집합(countable set)일 때 x는 이산랜덤변수(Discrete Random Variable)이다.

- 랜덤변수 x에 대해 실수값 3에 대응되는 실험 결과 s는 사건을 의미하는 것이고 확률에서 사용할 때는 P[{X=3}]으로 쓸 수 있다.

- {X > 0}과 같은 표현도 사건을 의미한다.

- 랜덤 변수가 어떤 값을 갖냐에 따라 사건을 정의할 수 있다.

 

 

(1) 유한 랜덤 변수(Finite Random variable)

- 랜덤 변수의 치역이 유한할 때 랜덤변수는 유한 랜덤 변수(Finite Random variable)이라 한다.

- 랜덤 변수가 어떤 값을 가질지는 몰라도 치역은 알 수 있기에 그 값 중 하나를 갖는다는 것을 알 수 있다. 확률질량함수가 이를 알려준다.

(2) PMF

 

 

PMF의 값이 0이면 치역에 없는 값인 것을 의미한다.

 

 

예제 2

- 윌트가 자유투를 던지기 전에는 x를 알 수 없기에 x는 랜덤 변수임

- 치역 = {0, 1, 2}

 

이에 대한 수학적 정의가 필요함

x의 치역이 아닌 값에 대해도 써줘야함

 

3) PMF란?

 

- 랜덤변수의 특징과 정의는 랜덤변수의 PMF에 의해 결정됨

- 어떤 랜덤 변수의 PMF가 주어진다면 그 랜덤변수의 모든 것을 알 수 있음

- 따라서 랜덤변수의 PMF만 표현되어도 알 수 있음

- 이산 랜덤 변수에 한해서 유용한 지표

- 이산랜덤변수의 정체성은 pmf를 통해 100% 결정된다.
- 랜덤변수의 파라미터 p는 숫자가 아직 정해지지 않은 것이기에 p를 하나의 변수임

 

 

(1) 증명

A, B, C는 상호배타적이며 파티션(전체 망라적)임

이에 따라 위의 증명은 참이고, sample space가 아닌 어떤 사건에 대한 확률을 구해도 마찬가지임

 

(2) 증명

 

예제 3

 

 

 

2. Families of discrete random variable

보편적으로 많이 접하는 이산랜덤변수


 

1) Bernoulli RV

 

- Bernoulli 랜덤변수의 치역은 0과 1이고 이에 대한 p(파라미터) 값은 각각 1 - p, p가 됨

 

예제 4)

동전 던지기 실험

- Bernoulli 랜덤변수는 0과 1임

 

 

예제 5

p(파라미터)는 0.2

 

 

2) Geometric RV

- 파라미터가 p인 랜덤변수

 

예제 6

동전 던지기 실험

 

- 위의 실험 구조는 원하는 결과가 나올 때까지 독립 시행을 n번 반복했을 때는 n이 geometric의 랜덤변수가 됨

 

예제 7

 

 

3) Binomial RV

이항분포와 동일함
독립시행 + n번 반복하는 경우에는 이를 사용하는 경우가 많음

파라미터 k, p인 pascal 랜덤변수
우리가 원하는 횟수만큼 나올때까지 테스트함
ex) 불량품이 나온 횟수가 네번이 나올때까지 테스트한 제품의 총 수를 랜덤변수x라함

 




 

4) Uniform

- 이산, 연속 둘다 있음
- 랜덤변수가 가질 수 있는 값들의 확률이 모두 동일함

 

 

5) poisson

문제에서 포아송 랜덤변수임을 상정함
일반적으로 a도 알려줌
교재예제는 별로

교재 예제에 나와있는 시나리오를 보고 어떤 랜덤변수인지 체크할 필요 있음

 

 

 

3. CDF

1) CDF란?

- PMF는 이산랜덤변수에 한해서 유용한 모델이지만 CDF는 연속랜덤변수에서도 사용할 수 있음

- 랜덤변수가 어떤 종류이든 상관없이 공통적으로 적용될 수 있는 확률 함수임

- 랜덤변수 x가 실수값 x보다 작을 확률

- CDF를 알면 PMF를 구할 수 있고, PMF를 알면 CDF를 구할 수 있음

 

 

대문자 F를 사용해서 이를 표현함, 아래첨자는 랜덤변수 x, 괄호는 실수값 x를 의미

- 모든 실수 x에 대해 CDF가 어떤 값을 가지는지 알아야 정의할 수 있음


2) CDF의 성질

 

성질 1

성질 2

비감소함수 -> x값이 커질수록 함수의 값은 이전 값보다 같거나 증가한다.

성질 3

CDF

이산랜덤분포의 CDF는 랜덤변수 x의 치역에 해당하는 점에서 점프가 발생한다.

 

성질 4

치역과 치역 사이의 값은 평평할 것이다.


3) CDF와 관련된 이론

 

 

 

 

예제 8

- CDF는 모든 함수값으로 다 드러나지만 otherwise는 포함되지 않음

- 이때 CDF를 구하라고 하면 함수를 정의하는 것이 중요함

728x90
반응형