이항 분포로부터 포아송 분포를 유도할 수 있다.
포아송 분포는 다음과 같은 상황에서의 이항 분포의 근사식이라고 할 수 있다.
가정: 확률 θ 는 작고 시행횟수 n 은 매우 클 경우 λ=nθ 로 둔다.
여기서 우리가 알아야 할 것은 n 은 무한으로 발산하고 θ 는 0으로 수렴하고 있다보니 λ 는 어떤 상수에 수렴할 것이라는 것이다.
그리고 이항 분포 Bi(x|\theta, n) = {n \choose x}\theta^x(1-\theta)^{n-x} 임을 알고 있다.
그럼 여기에서부터 포아송 분포 유도를 시작한다.
다음 식과 같이 이항 분포를 전개하면
\begin{matrix} Bi(k|\theta,n) & = & {n \choose k}\theta^k(1-\theta)^{n-k} \\ & = & n(n-1)\cdots(n-k+1)\frac{\theta^k}{k!}(1-\theta)^{n-k} \\ & = & \frac{n(n-1)\cdots(n-k+1)}{n^k}\frac{(n\theta)^k}{k!}(1-\theta)^n(1-\theta)^{-k} \\ & = & \frac{n(n-1)\cdots(n-k+1)}{n^k}\frac{\lambda^k}{k!}(1-\frac{\lambda}{n})^n(1-\frac{\lambda}{n})^{-k}\\ \end{matrix}
여기서 시행횟수 n \to \infty 하면 \frac{\lambda^k}{k!}\displaystyle \lim_{n \to \infty}(1-\frac{\lambda}{n})^n 를 제외하고는 모두 1로 수렴하게 된다.
그리고 \displaystyle \lim_{n \to \infty}(1-\frac{\lambda}{n})^n 은 e^{-\lambda} 임을 알고 있으므로 \displaystyle \lim_{n \to \infty}Bi(k|\theta, n)=\frac{\lambda^ke^{-\lambda}}{k!} 가 된다.
즉 포아송 분포 ( Poisson ) 분포라는 것은 시행횟수 n 은 크고 확률 \theta 는 작을 때의 이항분포를 뜻하고 위와 같은 유도를 통해서 구할 수 있다.
'통계' 카테고리의 다른 글
[답답해서 내가 정리한다] 중심극한정리 central limit theorem (0) | 2023.10.16 |
---|---|
multidimensional scaling (MDS) 의 개념과 PCA 와의 차이점 (0) | 2023.05.25 |
댓글