이항 분포로부터 포아송 분포를 유도할 수 있다.
포아송 분포는 다음과 같은 상황에서의 이항 분포의 근사식이라고 할 수 있다.
가정: 확률 $\theta$ 는 작고 시행횟수 $ n $ 은 매우 클 경우 $ \lambda = n\theta $ 로 둔다.
여기서 우리가 알아야 할 것은 $ n $ 은 무한으로 발산하고 $ \theta $ 는 0으로 수렴하고 있다보니 $ \lambda $ 는 어떤 상수에 수렴할 것이라는 것이다.
그리고 이항 분포 $ Bi(x|\theta, n) = {n \choose x}\theta^x(1-\theta)^{n-x} $ 임을 알고 있다.
그럼 여기에서부터 포아송 분포 유도를 시작한다.
다음 식과 같이 이항 분포를 전개하면
$$ \begin{matrix} Bi(k|\theta,n) & = & {n \choose k}\theta^k(1-\theta)^{n-k} \\ & = & n(n-1)\cdots(n-k+1)\frac{\theta^k}{k!}(1-\theta)^{n-k} \\ & = & \frac{n(n-1)\cdots(n-k+1)}{n^k}\frac{(n\theta)^k}{k!}(1-\theta)^n(1-\theta)^{-k} \\ & = & \frac{n(n-1)\cdots(n-k+1)}{n^k}\frac{\lambda^k}{k!}(1-\frac{\lambda}{n})^n(1-\frac{\lambda}{n})^{-k}\\ \end{matrix} $$
여기서 시행횟수 $ n \to \infty $ 하면 $ \frac{\lambda^k}{k!}\displaystyle \lim_{n \to \infty}(1-\frac{\lambda}{n})^n $ 를 제외하고는 모두 1로 수렴하게 된다.
그리고 $ \displaystyle \lim_{n \to \infty}(1-\frac{\lambda}{n})^n $ 은 $ e^{-\lambda} $ 임을 알고 있으므로 $$ \displaystyle \lim_{n \to \infty}Bi(k|\theta, n)=\frac{\lambda^ke^{-\lambda}}{k!} $$ 가 된다.
즉 포아송 분포 ($ Poisson $) 분포라는 것은 시행횟수 $ n $ 은 크고 확률 $ \theta $ 는 작을 때의 이항분포를 뜻하고 위와 같은 유도를 통해서 구할 수 있다.
'통계' 카테고리의 다른 글
[답답해서 내가 정리한다] 중심극한정리 central limit theorem (0) | 2023.10.16 |
---|---|
multidimensional scaling (MDS) 의 개념과 PCA 와의 차이점 (0) | 2023.05.25 |
댓글