- 区間推定
- \(\overline{X}_n\)を変数変換することによる標準正規分布への変換
- 多項分布の信頼区間
- 二項分布が標準正規分布に近似できること
統計学実践ワークブックの行間埋め 第9章
\(\overline{X}_n\sim N(\mu,\frac{\sigma^2}{n})\)であるとする。
\begin{eqnarray}
f_{\overline{X}_n}(x)&\sim& N(\mu,\sigma^2/n) \\ \\
&=&
\frac{1}{\sqrt{2\pi\sigma^2/n}}\exp\left(-\frac{(x-\mu)^2}{2\sigma^2/n}\right) \\ \\
\end{eqnarray}
となるため、p.21を参考にし、\(u=\frac{\overline{X}_n-\mu}{\sigma^2/n}\)で変数変換する。
\begin{eqnarray}
&&u&=&\frac{\overline{X}_n-\mu}{\sigma^2/n} \\ \\
&\Leftrightarrow&
\overline{X}_n&=&\frac{\sigma^2}{n}u+\mu \\ \\ \\
&&\frac{\partial}{\partial \overline{X_n}}u&=&\frac{n}{\sigma^2}
\end{eqnarray}
より
\begin{eqnarray}
f_{\overline{X}_n}(u\sqrt{\sigma^2/n}+\mu)\frac{1}{\sqrt{\frac{n}{\sigma^2}}}
&=&
\frac{1}{\sqrt{2\pi \sigma^2/n}}\exp \left(-\frac{(u\sqrt{\frac{\sigma^2}{n} }+\mu-\mu)^2}{2\frac{\sigma^2}{n}} \right)\sqrt{\frac{\sigma^2}{n}} \\
\\
&=&
\frac{1}{\sqrt{2\pi}}\exp \left(-\frac{u^2}{2} \right) \\ \\
&\sim&
N(0,1)
\end{eqnarray}
が得られる。
こちらの解説などを参考。
そうすることで、\(n\)が大きな値の時、二項分布としての多項分布は近似的に\(N(np_i,\; np_i(1-p_i))\)に従う。 その際、確率変数\(X\)の確率密度関数\(f_X(x)\)は、 \begin{eqnarray} f_X(x)=\frac{1}{\sqrt{2\pi np_i(1-p_i)}}\exp \left(-\frac{(x-np_i)^2}{2np_i(1-p_i)} \right) \end{eqnarray} となるが、expの中身を変形し、\(y=\frac{x}{n}\)と変数変換すると、 \begin{eqnarray} f_Y(y)&=& f_X(ny)\frac{d}{dy}(ny) \\ \\ &=& \frac{1}{\sqrt{2\pi np_i(1-p_i)}}\exp \left(-\frac{(y-p_i)^2}{2p_i(1-p_i)/n}n \right)n \\ \\ &=& \frac{1}{\sqrt{2\pi p_i(1-p_i)/n}}\exp \left(-\frac{(y-p_i)^2}{2p_i(1-p_i)/n}n \right) \end{eqnarray} という式が得られる。\(\hat{p}_i=\frac{N_i}{n}\)とし、確率変数\(U=\frac{\hat{p}_i-Y}{\sqrt{\hat{p_i}{1-p_i}/n}}\)への変数変換をする。周辺分布関数を\(F_U(u),\; F_Y(x)\)として変数変換後の確率密度関数を求めると、 \begin{eqnarray} F_U(u) &=& P(U\leq u) \\ \\ &=& P\left(\frac{\hat{p}_i-Y}{\sqrt{\hat{p_i}{1-p_i}/n}}\leq u\right) \\ \\ &=& P\left(Y\geq \hat{p}_i-u\sqrt{\hat{p}_i(1-\hat{p}_i)/n}\right) \\ \\ &=& 1-P\left(Y\leq \hat{p}_i-u\sqrt{\hat{p}_i(1-\hat{p}_i)/n}\right) \\ \\ &=& 1-F_Y\left(\hat{p}_i-u\sqrt{\hat{p}_i(1-\hat{p}_i)/n}\right) \\ \\ f_U(u) &=& \frac{d}{du}F_U(u) \\ \\ &=& \frac{d}{du}\left( 1-F_Y\left(\hat{p}_i-u\sqrt{\hat{p}_i(1-\hat{p}_i)/n}\right)\right) \\ \\ &=& -\sqrt{\hat{p}_i(1-\hat{p}_i)/n}\left( -f_Y\left(\hat{p}_i-u\sqrt{\hat{p}_i(1-\hat{p}_i)/n}\right)\right) \\ \\ &=& \sqrt{\hat{p}_i(1-\hat{p}_i)/n} \frac{1}{\sqrt{2\pi p_i(1-p_i)/n}}\exp \left(-\frac{(\hat{p}_i-u\sqrt{\hat{p}_i(1-\hat{p}_i)/n}-p_i)^2}{2p_i(1-p_i)/n} \right) \\ \\ &=& \frac{1}{\sqrt{2\pi}}\exp \left(-\frac{u^2}{2} \right) \\ \\ \end{eqnarray} となり、標準正規分布が得られる。
そうすることで、\(n\)が大きな値の時、二項分布としての多項分布は近似的に\(N(np_i,\; np_i(1-p_i))\)に従う。 その際、確率変数\(X\)の確率密度関数\(f_X(x)\)は、 \begin{eqnarray} f_X(x)=\frac{1}{\sqrt{2\pi np_i(1-p_i)}}\exp \left(-\frac{(x-np_i)^2}{2np_i(1-p_i)} \right) \end{eqnarray} となるが、expの中身を変形し、\(y=\frac{x}{n}\)と変数変換すると、 \begin{eqnarray} f_Y(y)&=& f_X(ny)\frac{d}{dy}(ny) \\ \\ &=& \frac{1}{\sqrt{2\pi np_i(1-p_i)}}\exp \left(-\frac{(y-p_i)^2}{2p_i(1-p_i)/n}n \right)n \\ \\ &=& \frac{1}{\sqrt{2\pi p_i(1-p_i)/n}}\exp \left(-\frac{(y-p_i)^2}{2p_i(1-p_i)/n}n \right) \end{eqnarray} という式が得られる。\(\hat{p}_i=\frac{N_i}{n}\)とし、確率変数\(U=\frac{\hat{p}_i-Y}{\sqrt{\hat{p_i}{1-p_i}/n}}\)への変数変換をする。周辺分布関数を\(F_U(u),\; F_Y(x)\)として変数変換後の確率密度関数を求めると、 \begin{eqnarray} F_U(u) &=& P(U\leq u) \\ \\ &=& P\left(\frac{\hat{p}_i-Y}{\sqrt{\hat{p_i}{1-p_i}/n}}\leq u\right) \\ \\ &=& P\left(Y\geq \hat{p}_i-u\sqrt{\hat{p}_i(1-\hat{p}_i)/n}\right) \\ \\ &=& 1-P\left(Y\leq \hat{p}_i-u\sqrt{\hat{p}_i(1-\hat{p}_i)/n}\right) \\ \\ &=& 1-F_Y\left(\hat{p}_i-u\sqrt{\hat{p}_i(1-\hat{p}_i)/n}\right) \\ \\ f_U(u) &=& \frac{d}{du}F_U(u) \\ \\ &=& \frac{d}{du}\left( 1-F_Y\left(\hat{p}_i-u\sqrt{\hat{p}_i(1-\hat{p}_i)/n}\right)\right) \\ \\ &=& -\sqrt{\hat{p}_i(1-\hat{p}_i)/n}\left( -f_Y\left(\hat{p}_i-u\sqrt{\hat{p}_i(1-\hat{p}_i)/n}\right)\right) \\ \\ &=& \sqrt{\hat{p}_i(1-\hat{p}_i)/n} \frac{1}{\sqrt{2\pi p_i(1-p_i)/n}}\exp \left(-\frac{(\hat{p}_i-u\sqrt{\hat{p}_i(1-\hat{p}_i)/n}-p_i)^2}{2p_i(1-p_i)/n} \right) \\ \\ &=& \frac{1}{\sqrt{2\pi}}\exp \left(-\frac{u^2}{2} \right) \\ \\ \end{eqnarray} となり、標準正規分布が得られる。