확률분포의 기댓값(평균), 표준편차

2020. 7. 19. 22:04데이터 분석 기본

반응형

[확률변수의 기대값(평균)]

표본자료에서 평균은 자료의 중심을 나타내는 대표적인 지표임과 동시에 그 자료를 설명하는 가장 대표적인 지표였습니다. 예를 들어 어떤 퀴즈 대회에서 상금으로 10,000원, 100,000원, 1,000,000원 10,000,000원을 지급한다고 하면 상금의 평균은 각 상금의 합을 4로 나눈 2,777,500원이 될 것이며, 퀴즈 대회에 참여한 사람들은 평균적으로 2,777,500원을 얻을 수 있을 것이라고 생각 할 수 있을 것입니다.

만약 10,000원, 100,000원, 1,000,000원 10,000,000원의 상금을 탈 확률이 다르다면 어떻게 될까요? 아마 우리가 퀴즈를 통해 평균적으로 얻을 수 있다고 생각하는 상금은 달라질 것입니다. 각 상금을 탈 확률이 아래의 표와 같다고 가정해보겠습니다.

상금 확률
10,000원 5/10
100,000원 3/10
1,000,000원 2/10
10,000,000원 1/10

이 때 우리가 퀴즈 대회를 통해 얻을 수 있는 상금의 기대 값은 아래와 같이 1,235,000원일 것입니다.

따라서 우리는 확률분포의 기대값을 아래와 같이 정의 할 수 있습니다.

가질 수 있는 확률변수 값을 x, 그 값을 가질 확률을 f(x)로 표현하면 기대값은 다시 아래와 같이 표현 할 수 있습니다.

 

[확률변수의 표준편차]

표준편차는 자료에서 얼마나 퍼져있는지를 나타내는 지표이며 아래와 같이 계산을 통하여 모집단의 분산과 표준편차 s를 도출했습니다.

확률변수의 표준편차도 위의 식과 거의 동일합니다, 다만 모집단의 자료 수(n)로 편차의 제곱의 합을 나눠주는 것이 아니라 그 값을 가질 확률을 곱해주는 것이 차이점입니다.

따라서, 확률 변수 X의 분산과 표준편차는 아래와 같이 정의 됩니다.

가질 수 있는 확률변수 값을 x, 그 값을 가질 확률을 f(x)로 표현하면 표준편차는 다시 아래와 같이 표현 할 수 있습니다.

분산을 손쉽게 계산하기 위한 간편식은 아래와 같습니다.

 

반응형

'데이터 분석 기본' 카테고리의 다른 글

포아송 분포  (0) 2020.07.23
베르누이 시행과 이항 분포  (0) 2020.07.20
확률변수, 확률분포  (0) 2020.07.16
조건부 확률과 베이즈 정리  (2) 2020.07.14
확률의 기본 연산  (0) 2020.07.12