BigJoo 2024. 4. 19. 18:19

한양대학교 이상화 교수님의 확률 및 통계 강의를 수강하고 정리한 내용입니다

 

 

고등학교에서 배웠던 순열에 대해서 다시 한번 상기시킵니다.

 

 

 

 

 

고등학교에서 배웠던 Combination입니다. n+m개의 전체집합에서 r개를 뽑는 것은 n개 중에서 k개를 뽑고, m개에서 r-k개를 뽑는 것으로 생각할 수 있습니다.

 

 

 

 

 

확률을 함수로 생각하는 것에 대해서 배웁니다. 위의 식처럼 이항정리를 함수로 생각할 수 있습니다.

 

 

 

 

  • Random Variable이란 Random experiment의 결과를 real value로 mapping하는 것을 말합니다.
  • 간단하게 예시를 들어서 설명해보겠습니다. 동전 1개를 던지는 Random experiment를 실행하는 경우에 동전의 앞면의 갯수를 Random Variable로 설정하게 된다면, 가능한 RV의 값은 0과 1이고, 각각의 확률은 0.5, 0.5입니다. 이를 함수로 생각해본다면, 함수의 input값으로 설정한 RV값이 들어가게 되고, P(0) = 0.5, P(1) = 0.5로 표현할 수 있습니다.
  • RV를 정의함으로써 A라는 event가 아닌 x라는 real value가 input값이 되어 함수의 형태가 됩니다. 

 

 

 

 

정의한 Random Variable X와 real value x를 나타내는 Distribution Function중에서 CDF에 대해서 배웁니다. CDF는 누적된 확률값을 outcome으로 갖는 함수를 말하며, 위의 예시에서 F(1)은 Random Variable X<= 1 인 모든 확률값의 합을 outcome으로 갖습니다.

 

 

 

 

CDF는 이전의 outcome들을 계속해서 더해나가는 함수이기에 non-decreasing한 성질을 갖고 있고, 추가적으로 다음과 같은 성질을 갖고 있습니다. CDF를 알고 있다는 것은 Random Variable에 대해서 완벽하게 알고 있다는 것을 의미합니다. 

 

 

 

 

다음으로는 RV가 불연속인 경우에 사용할 수 있는 PMF(확률 질량 함수)에 대해서 배웁니다. 이는 특정 Random Variable에 대한 확률을 나타내는 함수입니다. 동전 2개를 던지는 경우에 대해서 생각해보면, 앞면의 갯수가 RV일 때, 가능한 값은 0,1,2가 있고, 각각의 확률은 0.25, 0.5, 0.25입니다. 이때, 각각의 확률이 PMF의 outcome값이라고 생각하면 됩니다.

 

 

 

 

만약 Px에 대한 모든 값을 알고 있다면, 이를 바탕으로 CDF도 정의할 수 있습니다.