통계(24)
-
가설검정 > 가설, 검정통계량
가설검정에는 두 개의 가설이 있습니다. 하나는 우리가 주장하고자 하는 가설이고, 다른 하나는 그 주장을 입증할 수 없을 때 주장을 무효화하면서 받아들여야 하는 가설입니다. [가설의 종류] 이 때 우리가 주장하는 가설을 대립가설(Alternative Hypothesis, H1)라고 하며, 주장을 입증할 수 없을 때 받아들여야 하는 가설을 귀무가설(Null Hypothesis, H0)라고 합니다. 앞선 포스팅(https://direction-f.tistory.com/26)에서 언급한 초등학생 대상 다이어트 프로그램이 효과에 대해 대립가설과 귀무가설을 세우면 아래와 같이 됩니다. 대립가설(H1) : 다이어트 프로그램은 초등학생들의 평균 몸무게를 줄였을 것이다(μ
2020.08.09 -
가설검정
가설검정(Testing statistical hypotheses)은 모수에 대한 가설이 적합한지를 추출한 표본으로부터 판단하는 것을 나타내는 것입니다. 전국의 초등학교에서 6학년의 비만인 남자 학생(모집단)의 체중 평균이 70이고 표준편차가 7라고 가정해보겠습니다. 동시에 교육부에서 특정 다이어트 프로그램을 대대적으로 홍보했다고 가정해보겠습니다. 그럼 이러한 다이어트 프로그램 수행을 통해서 실제로 평균이 낮아졌는지를 판단하기 위해서 어떠한 과정을 거쳐야 할까요? 이러한 질문에 답을 하기 위해서 필요한 것이 가설검정입니다. 다이어트 프로그램 수행 후의 비만인 남자 학생들의 평균 몸무게를 μ라고 해보겠습니다. 우리는 전국의 비만인 남자 학생들을 다 조사할 수 없기 때문에 표본을 추출하여 표본의 평균을 구하는..
2020.08.06 -
통계적 추론(구간 추정)
점 추정은 모집단의 특성을 나타내는 하나의 값을 추정하는 것이었습니다. 반면 구간 추정(Interval Estimation)은 추정량(Estimator)의 분포를 활용하여 모집단의 특성을 나타내는 값을 포함하리라고 생각되는 구간을 추정하는 것입니다. [구간 추정] 우리가 구간을 추정을 통해 모수 값(모집단의 특성을 나타내는 값)을 포함하는 구간을 추정하는데, 이 구간을 신뢰구간(Confidence Interval)이라고 부릅니다. 신뢰구간은 상한과 하한이 있고 (L,U)형태로 가지게 됩니다. 이 때 L이 -∞이고 U가 ∞라면 모수 값이 어떻게 되더라도 신뢰구간에 포함되게 될 것입니다. 따라서 우리는 상한과 하한값을 제한 할 필요가 있습니다. 이 필요로 인해서 우리가 흔히 들어본 95% 신뢰구간, 90% ..
2020.08.04 -
통계적 추론(점 추정)
통계적 추론이란 우리가 가지고 있는 표본으로부터 모집단의 특성을 추론하는 것을 말합니다. 다시 말하면, 통계적 추론은 표본으로부터 모집단의 특성을 유도하고 그 특성이 옳은지 그른지를 판단하는 것입니다. 모집단의 특성을 추정하는 것에는 점 추정(Point Estimiation)과 구간 추정(Interval Estimation)이 있습니다. 점추정은 모집단의 특성을 나타내리라 생각하는 하나의 값을 추정하는 것이고, 구간 추정은 하나의 값만을 추정하는 것이 아니라 모수를 포함하리라 생각하는 적절한 구간을 추정하는 것입니다. [점 추정] 모수를 추정하기 위해 모집단에서 크기가 n인 표본을 추출한다고 가정해보겠습니다. 그렇다면, 표본의 평균은 아래와 같을 것입니다. 이때 표본의 평균은 추정량(estimator)가..
2020.08.03 -
포아송 분포
만약 우리가 금은방을 운영하고 있다고 가정해보겠습니다. 퇴근 후 한 시간에 도둑이이 10명 올 확률은 어떻게 될까요? 100명이 올 확률은 어떻게 될까요?(도둑이 오면 안되겠지만요...) 이와 같이 일정 기간 동안에 확률이 낮은 특정 사건이 일어날 확률을 나타내기 위해 활용하는 것이 포아송 분포입니다. 다시 위의 예를 좀 더 깊게 들여보다면 저 확률을 이항분포로 나타낼 수 있지 않을까? 하는 생각이 드실 수도 있습니다. 다시 말하면 1분에 도둑이 올 확률이 0.01 오지 않을 확률이 0.99라면 이는 결과가 두 가지 뿐인 베르누이 시행으로 간주할 수 있습니다. 따라서 한 시간(60분)은 베르누이 시행을 60번 시행했다고 볼 수 있을 것입니다. 하지만 도둑이 1분에 한명만 오는 것이라고 한정할 수 없습니다..
2020.07.23 -
베르누이 시행과 이항 분포
[베르누이 시행] 실험을 통해 얻을 수 있는 결과가 두 가지만 있다고 생각해보겠습니다. 예를 들어 동전을 던지는 실험을 했을 때 우리가 얻을 수 있는 결과는 앞면(H)와 뒷면(T) 두 가지 뿐입니다. 예와 같이 두 가지의 결과만 반복해서 나오며, 아래와 같은 조건을 만족하는 경우 이를 베르누이 시행이라고 부릅니다. 1) 각 시행은 성공(S), 실패(F)의 두 결과만을 갖는다(우리가 흔히 사용하는 성공의, 실패의 의미와는 무관, 결과가 두 개 뿐임을 강조) 2) 각 시행에서 성공할 확률 P(S)=p, 실패활 확률 P(F)=q(=1-p)로 그 값이 일정함 3) 각 시행은 서로 독립으로 각 시행의 결과가 다른 시행의 결과에 영향을 미치지 않음 [이항분포(Binomial distribution)] 위와 같은 조..
2020.07.20