확률 및 랜덤변수(5), 통계와 확률

2022. 4. 16. 02:44강의 내용 정리/확률및랜덤변수

728x90
반응형

통계와 확률

통계: 데이터를 다루는 것에 초점이 맞춰져 있다.

확률: 이론적인 부분에 초점이 맞춰져있다.

 

1. 통계

1) 개념

- Mode는 최빈값을 의미한다.

 

 

예제) Mean, Median, Mode 구하기

 

2) 기대치, 중간값, 최빈값 구하기 공식

(1) 기대치

확률에서의 기대치는 다음과 같은 공식을 사용해 구한다.

 

(2) Median

Median은 다음과 같이 구할 수 있다.

 

(3) Mode

Mode는 다음과 같이 구할 수 있다.

 

예제 2) 기대값 구하기

 

3) 이산 랜덤 변수에서의 기대치 공식

(1) Bernoulli 랜덤변수의 기대치

 

증명

 

(2) Geometric 랜덤변수의 기대치

증명

- 공비수열의 합공식을 사용해 A를 구한다.

 

(3) Poisson 랜덤변수의 기대치

 

(4) 기타 랜덤변수의 기대치

 

2. Function of random variable

1) 개념

랜덤변수 x를 직접다루는 것이 아닌 x에 대한 함수의 결과값을 다루는 것을 의미한다.


통신 신호의 세기를 랜덤변수로 취했을 때의 함수 값 또한 x로부터 유도되었기 때문에 function of random variable이라 한다. 이때의 함수의 분포를 아는 것이 중요하다.

 

- 해당 function of random 변수의 분포는 유도된 랜덤변수의 PMF나 CMF를 구하는 것이 주 관심사이다.

 

예제 1) Foo와 Boo가 두번 동전을 던질 때의 돈을 얼마 벌 수 있나?

- Foo가 받을 수 있는 돈에 대한 함수인 y는 x로부터 유도된다. 

- 랜덤 변수 x가 주어졌다는 것은 x에 대한 PMF가 주어진 것이다.

- 랜덤 변수 x로부터 유도된 함수의 PMF를 구하는 것이 요지이다.

 

2) Function of random variable의 공식

(1) Function of random variable에서의 치역과 정의역

- y1이 도출되기 위해선 랜덤변수의 값이 x1이어야한다. 따라서 다음과 같이 치역과 정의역을 한정지어 PMF를 구할 수 있다.

 

 

(2) Function or random variable의 PMF

이를 수식으로 작성하면 다음과 같다.

 

예제) 이산 정규분포를 가지는 랜덤변수 v에 대한 함수의 PMF 구하기

 

y의 치역은 {0, 1, 4, 9}가 될 수 있기에 이에 대해 PMF를 구해주면 된다.

Py(0)과 Py(1)은 생략

 

 

(3) function of random variable의 기대치 공식

유도된 function of random variable의 PMF를 구하지 않고, 주어진 랜덤변수 x의 PMF와 실수함수 g(x)를 통해 기대치를 구할 수 있다.

 

 

이 공식을 활용해 '이산 정규분포를 가지는 랜덤변수 v에 대한 함수의 PMF 구하기'의 예제에서 기대치를 구할 수 있다.

 

예제) 이산 정규분포를 가지는 랜덤변수 v에 대한 함수의 기대치 구하기 - 2

 

x - ux 또한 기대치에 관한 function of random variable에 대한 문제이다.

 

 

 

 

증명

 

예제 1)

 

 

예제 2)

 

 

 

예제 3)

 

PMF와 CDF를 알면 다음과 같은 내용에 대해서도 알 수 있다.

평균: 랜덤변수의 대표값으로 사용할 수 있지만 완전한 정보를 제공하는 것은 아니다.

ex) 평균이 랜덤변수를 대표하기는 어려운 이유

 

- 위와 같은 상황 때문에 분산과 표준편차를 함께 사용해 랜덤변수 x가 얼마나 퍼져있는 지에 대해 알려줌

- 퍼져있는 정도가 음인지, 양인지는 확인할 필요가 없으니 x - ux의 제곱에 대한 기대치를 구한다.

 

 

 

비공식적으로 [평균 - 표준편차와 평균 + 표준편차] 사이에 있는 x값에 대해 '전형적'(typical)이라고 얘기한다.

 

 

 

 

 

 

- 랜덤변수 x의 모든 모멘트를 알면 랜덤변수 x의 PMF와 CDF를 아는 것처럼 랜덤변수 x의 모든 것을 아는 것과 같다.

why? 이를 활용해 pmf를 유도할 수 있기 때문이다.

 

예제) 

 

 

증명

 

 

 

그 외의 이산랜덤변수에서의 분산 공식

 

728x90
반응형