統計学の行間埋め 第4章
\(\S\)4.2 検定法の導出
- p.93:ネイマン-ピアソンの基本定理の導出
- p.97:式(4.2.7)を最大化するパラメータがp.97下の式で表されること
- 式(4.2.9)の導出
- p.98上:式(4.2.8)を最大化するパラメータの導出
- 式(4.2.10)の導出
- p.98:尤度比\(L\)の導出
- p.99:\(2\log L\to \chi^2(p)\)になること
- p.99:ワルド検定において\(W\to \chi^2(1)\)になること
- 式(4.2.15)の導出
- p.100下:\(R\)が\(\chi^2(1)\)になること
- p.101上:\(R\)の初めの式変形
式(4.2.7)は\(X_1\)に依存した部分と\(X_2\)に依存した部分のそれぞれを最大化するようにパラメータを選択すれば良い。従ってp.61より決定できる。
式(4.2.7)に尤度を最大化するパラメータを代入する。
\begin{eqnarray}
\displaystyle\sup_{\Theta_1}f(x;\mu_1,\mu_2,\sigma_1^2,\sigma_2^2)
&=&
\frac{1}{(2\pi\hat{\sigma}_1^2)^{n/2}}\exp\left(-\frac{1}{2\hat{\sigma}_1^2}\displaystyle\sum_{i=1}^n(x_{1i}-\mu_1)^2\right)\times\frac{1}{(2\pi\hat{\sigma}_2^2)^{n/2}}\exp\left(-\frac{1}{2\hat{\sigma}_2^2}\displaystyle\sum_{i=1}^n(x_{2i}-\mu_2)^2\right) \\ \\
&=&
\frac{1}{(2\pi\hat{\sigma}_1^2)^{n/2}}\exp\left(-\frac{1}{2\hat{\sigma}_1^2}\displaystyle\sum_{i=1}^n(x_{1i}-\overline{x}_1)^2\right)\times\frac{1}{(2\pi\hat{\sigma}_2^2)^{n/2}}\exp\left(-\frac{1}{2\hat{\sigma}_2^2}\displaystyle\sum_{i=1}^n(x_{2i}-\overline{x}_2)^2\right)&...&\mu_1=\overline{x}_1,\mu_2=\overline{x}_2\text{を代入} \\ \\
&=&
\frac{1}{(2\pi\hat{\sigma}_1^2)^{n/2}}\exp\left(-\frac{n}{2\hat{\sigma}_1^2}\displaystyle\frac{1}{n}\sum_{i=1}^n(x_{1i}-\overline{x}_1)^2\right)\times\frac{1}{(2\pi\hat{\sigma}_2^2)^{n/2}}\exp\left(-\frac{n}{2\hat{\sigma}_2^2}\displaystyle\frac{1}{n}\sum_{i=1}^n(x_{2i}-\overline{x}_2)^2\right)& \\ \\
&=&
\frac{1}{(2\pi\hat{\sigma}_1^2)^{n/2}}\exp\left(-\frac{n}{2\hat{\sigma}_1^2}\hat{\sigma}_1^2\right)\times\frac{1}{(2\pi\hat{\sigma}_2^2)^{n/2}}\exp\left(-\frac{n}{2\hat{\sigma}_2^2}\hat{\sigma}_2^2\right)&...&\displaystyle\frac{1}{n}\sum_{i=1}^n(x_{ji}-\overline{x}_j)^2=\hat{\sigma}_j^2\text{を代入} \\ \\
&=&
\frac{1}{(2\pi\hat{\sigma}_1^2)^{n/2}}\exp\left(-\frac{n}{2}\right)\times\frac{1}{(2\pi\hat{\sigma}_2^2)^{n/2}}\exp\left(-\frac{n}{2}\right)& \\ \\
&=&
(2\pi)^{-n}\exp\left(-n\right)(\hat{\sigma}_1^2\hat{\sigma}_2^2)^{-n/2}
\end{eqnarray}
と導出できる。
平均\(\mu_1,\mu_2\)について、式(4.2.8)は\(X_1\)に依存した部分と\(X_2\)に依存した部分のそれぞれを最大化するようにパラメータを選択すれば良い。従ってp.61より決定できる。
分散\(\sigma=\sigma_1=\sigma_2\)については、対数尤度を微分して\(0\)になるときの値を求める。\(v=\sigma^2\)とおくと
\begin{eqnarray}
\frac{\partial}{\partial v}\log f(x;\mu_1,\mu_2,v)
&=&
\frac{\partial}{\partial v}\log\left[\frac{1}{(2\pi v)^{n/2}}\exp\left(-\frac{1}{2v}\displaystyle\sum_{i=1}^n(x_{1i}-\mu_1)^2\right)\times\frac{1}{(2\pi v)^{n/2}}\exp\left(-\frac{1}{2v}\displaystyle\sum_{i=1}^n(x_{2i}-\mu_2)^2\right)\right] \\ \\
&=&
\frac{\partial}{\partial v}\log\left[\frac{1}{(2\pi v)^{n}}\exp\left(-\frac{1}{2v}\displaystyle\sum_{i=1}^n(x_{1i}-\mu_1)^2\right)\exp\left(-\frac{1}{2v}\displaystyle\sum_{i=1}^n(x_{2i}-\mu_2)^2\right)\right] \\ \\
&=&
\frac{\partial}{\partial v}\left[-n\log v-n\log 2\pi-\frac{1}{2v}\displaystyle\sum_{i=1}^n(x_{1i}-\mu_1)^2-\frac{1}{2v}\displaystyle\sum_{i=1}^n(x_{2i}-\mu_2)^2\right] \\ \\
&=&
-\frac{n}{v}+\frac{1}{2v^2}\displaystyle\sum_{i=1}^n(x_{1i}-\mu_1)^2+\frac{1}{2v^2}\displaystyle\sum_{i=1}^n(x_{2i}-\mu_2)^2 \\ \\
&=&
0 \\ \\
\Leftrightarrow
v
&=&
\frac{1}{2n}\displaystyle\sum_{i=1}^n(x_{1i}-\mu_1)^2+\frac{1}{2n}\displaystyle\sum_{i=1}^n(x_{2i}-\mu_2)^2 \\ \\
&=&
\frac{1}{2}\frac{1}{n}\displaystyle\sum_{i=1}^n(x_{1i}-\overline{x}_1)^2+\frac{1}{2}\frac{1}{n}\displaystyle\sum_{i=1}^n(x_{2i}-\overline{x}_2)^2 \\ \\
&=&
\frac{1}{2}\hat{\sigma}_1^2+\frac{1}{2}\hat{\sigma}_2^2 \\ \\
\Leftrightarrow
\hat{\sigma}^2&=&\frac{1}{2}(\hat{\sigma}_1^2+\hat{\sigma}_2^2)
\end{eqnarray}
と導出できる。
式(4.2.8)に尤度を最大化するパラメータを代入する。
\begin{eqnarray}
\displaystyle\sup_{\Theta_0}f(x;\mu_1,\mu_2,\sigma^2)
&=&
\frac{1}{(2\pi\hat{\sigma}^2)^{n/2}}\exp\left(-\frac{1}{2\hat{\sigma}^2}\displaystyle\sum_{i=1}^n(x_{1i}-\mu_1)^2\right)\times\frac{1}{(2\pi\hat{\sigma}^2)^{n/2}}\exp\left(-\frac{1}{2\hat{\sigma}^2}\displaystyle\sum_{i=1}^n(x_{2i}-\mu_2)^2\right) \\ \\
&=&
\frac{1}{(2\pi\hat{\sigma}^2)^{n}}\exp\left(-\frac{1}{2\hat{\sigma}^2}\displaystyle\sum_{i=1}^n(x_{1i}-\mu_1)^2\right)\exp\left(-\frac{1}{2\hat{\sigma}^2}\displaystyle\sum_{i=1}^n(x_{2i}-\mu_2)^2\right) \\ \\
&=&
(2\pi)^{-n}(\hat{\sigma}^2)^{-n}\exp\left(-\frac{n}{2\hat{\sigma}^2}\frac{1}{n}\displaystyle\sum_{i=1}^n(x_{1i}-\overline{x}_1)^2\right)\exp\left(-\frac{n}{2\hat{\sigma}^2}\frac{1}{n}\displaystyle\sum_{i=1}^n(x_{2i}-\overline{x}_2)^2\right) \\ \\
&=&
(2\pi)^{-n}(\hat{\sigma}^2)^{-n}\exp\left(-\frac{n}{2\hat{\sigma}^2}\sigma_1^2\right)\exp\left(-\frac{n}{2\hat{\sigma}^2}\sigma_2^2\right) \\ \\
&=&
(2\pi)^{-n}(\hat{\sigma}^2)^{-n}\exp\left(-\frac{n}{\hat{\sigma}^2}\frac{1}{2}(\hat{\sigma}_1^2+\hat{\sigma}_2^2)\right) \\ \\
&=&
(2\pi)^{-n}(\hat{\sigma}^2)^{-n}\exp\left(-\frac{n}{\hat{\sigma}^2}\hat{\sigma}^2\right) \\ \\
&=&
(2\pi)^{-n}(\hat{\sigma}^2)^{-n}\exp\left(-n\right) \\ \\
\end{eqnarray}
と導出できる。
\begin{eqnarray}
L
&=&
\frac{\displaystyle\sup_{\Theta_1}f(x;\mu_1,\mu_2,\sigma_1^2,\sigma_2^2)}{\displaystyle\sup_{\Theta_0}f(x;\mu_1,\mu_2,\sigma^2)} \\ \\
&=&
\frac{(2\pi)^{-n}\exp\left(-n\right)(\hat{\sigma}_1^2\hat{\sigma}_2^2)^{-n/2}}{(2\pi)^{-n}\exp\left(-n\right)(\hat{\sigma}^2)^{-n}}&...&\text{式(4.2.9)(4.2.10)より} \\ \\
&=&
\frac{(\hat{\sigma}_1^2\hat{\sigma}_2^2)^{-n/2}}{(\hat{\sigma}^2)^{-n}}& \\ \\
&=&
\frac{(\hat{\sigma}^2)^{n}}{(\hat{\sigma}_1^2\hat{\sigma}_2^2)^{n/2}}& \\ \\
&=&
\left(\frac{(\hat{\sigma}^4)^{n/2}}{(\hat{\sigma}_1^2\hat{\sigma}_2^2)^{n/2}}\right)& \\ \\
&=&
\left(\frac{\hat{\sigma}^4}{\hat{\sigma}_1^2\hat{\sigma}_2^2}\right)^{n/2}& \\ \\
&=&
\left(\frac{\left[\frac{1}{2}(\hat{\sigma}_1^2+\hat{\sigma}_2^2)\right]^2}{\hat{\sigma}_1^2\hat{\sigma}_2^2}\right)^{n/2}&...&\text{p.98上より} \\ \\
&=&
\left(\frac{1}{2}\right)^{2\cdot\frac{n}{2}}\left(\frac{(\hat{\sigma}_1^2+\hat{\sigma}_2^2)^2}{\hat{\sigma}_1^2\hat{\sigma}_2^2}\right)^{n/2} \\ \\
&=&
\left(\frac{1}{2^2}\right)^{\frac{n}{2}}\left[\left(\frac{\hat{\sigma}_1^2+\hat{\sigma}_2^2}{\hat{\sigma}_1\hat{\sigma}_2}\right)^2\right]^{n/2} \\ \\
&=&
\left(\frac{1}{4}\right)^{n/2}\left(\frac{\hat{\sigma}_1^2+\hat{\sigma}_2^2}{\hat{\sigma}_1\hat{\sigma}_2}\right)^n \\ \\
&=&
\left(\frac{1}{4}\right)^{n/2}\left(\frac{\hat{\sigma}_1^2}{\hat{\sigma}_1\hat{\sigma}_2}+\frac{\hat{\sigma}_2^2}{\hat{\sigma}_1\hat{\sigma}_2}\right)^n \\ \\
&=&
\left(\frac{1}{4}\right)^{n/2}\left(\frac{\hat{\sigma}_1}{\hat{\sigma}_2}+\frac{\hat{\sigma}_2}{\hat{\sigma}_1}\right)^n \\ \\
\end{eqnarray}
と導出できる。
現代数理統計学の基礎やデータ解析のための数理統計入門など参考にすると、
\begin{eqnarray}
(\hat{\theta}-\theta_0)\sqrt{I_F(\hat{\theta})}\sim N(0,1)
\end{eqnarray}
になることがわかる。標準正規分布の二乗は自由度\(1\)の\(\chi^2\)分布であるため、
\begin{eqnarray}
\left((\hat{\theta}-\theta_0)\sqrt{I_F(\hat{\theta})}\right)^2
&=&
(\hat{\theta}-\theta_0)^2I_F(\hat{\theta}) \\ \\
&\sim& \chi^2(1)
\end{eqnarray}
が得られる。
\begin{eqnarray}
I_F(\sigma^2)
&=&
E\left[\left(\frac{d\log f}{d\sigma^2}\right)\right] \\ \\
&=&
E\left[\left\{-\frac{1}{2\sigma^2}\left(n-\displaystyle\sum_{i=1}^n\left(\frac{x_i}{\sigma}\right)^2\right)\right\}^2\right]&...&\text{式(4.2.14)より} \\ \\
&=&
\frac{1}{4\sigma^4}E\left[\left(n-\displaystyle\sum_{i=1}^n\left(\frac{x_i}{\sigma}\right)^2\right)^2\right] \\ \\
&=&
\frac{1}{4\sigma^4}E\left[n^2-2n\displaystyle\sum_{i=1}^n\left(\frac{x_i}{\sigma}\right)^2+\left(\displaystyle\sum_{i=1}^n\left(\frac{x_i}{\sigma}\right)^2\right)^2\right] \\ \\
&=&
\frac{1}{4\sigma^4}n^2-\frac{1}{4\sigma^4}2nE\left[\displaystyle\sum_{i=1}^n\left(\frac{x_i}{\sigma}\right)^2\right]+\frac{1}{4\sigma^4}E\left[\left(\displaystyle\sum_{i=1}^n\left(\frac{x_i}{\sigma}\right)^2\right)^2\right] \\ \\
&=&
\frac{1}{4\sigma^4}n^2-\frac{1}{4\sigma^4}\frac{2n}{\sigma^2}\displaystyle\sum_{i=1}^nE\left[x_i^2\right]+\frac{1}{4\sigma^4}\frac{1}{\sigma^4}E\left[\left(\displaystyle\sum_{i=1}^nx_i^2\right)^2\right] \\ \\
&=&
\frac{1}{4\sigma^4}n^2-\frac{1}{4\sigma^4}\frac{2n}{\sigma^2}\displaystyle\sum_{i=1}^n(\underbrace{V[x_i]+(E\left[x_i\right])^2}_{V[x]=E[x^2]-(E[x])^2})+\frac{1}{4\sigma^8}E\left[2\displaystyle\sum_{i=1}^n\sum_{j=1}^{i-1}x_i^2x_j^2+\displaystyle\sum_{i=1}^nx_i^4\right] \\ \\
&=&
\frac{1}{4\sigma^4}n^2-\frac{1}{4\sigma^4}\frac{2n}{\sigma^2}\displaystyle\sum_{i=1}^n(\sigma^2+0^2)+\frac{1}{4\sigma^8}2\displaystyle\sum_{i=1}^n\sum_{j=1}^{i-1}E\left[x_i^2x_j^2\right]+\frac{1}{4\sigma^8}\displaystyle\sum_{i=1}^nE\left[x_i^4\right] \\ \\
&=&
\frac{1}{4\sigma^4}n^2-\frac{1}{4\sigma^4}\frac{2n}{\sigma^2}n\sigma^2+\frac{1}{4\sigma^8}2\displaystyle\sum_{i=1}^n\sum_{j=1}^{i-1}\underbrace{E[x_i^2]E[x_j^2]}_{(1)}+\frac{1}{4\sigma^8}\displaystyle\sum_{i=1}^n\underbrace{3\sigma^4}_{(2)}&...&\text{(1)独立であるため(2)正規分布の尖度が3であるため} \\ \\
&=&
\frac{1}{4\sigma^4}n^2-\frac{2n^2}{4\sigma^4}+\frac{1}{4\sigma^8}2\displaystyle\sum_{i=1}^n\sum_{j=1}^{i-1}\sigma^2\sigma^2+\frac{1}{4\sigma^8}n3\sigma^4 \\ \\
&=&
-\frac{n^2}{4\sigma^4}+\frac{1}{4\sigma^4}2\frac{n(n-1)}{2}+\frac{3n}{4\sigma^4} \\ \\
&=&
\frac{n}{2\sigma^4} \\ \\
\end{eqnarray}
が得られる。
現代数理統計学の基礎など参考にすると、
\begin{eqnarray}
\frac{s(\theta_0)}{\sqrt{I_F(\theta_0)}}\sim N(0,1)
\end{eqnarray}
となる。標準正規分布の二乗は自由度\(1\)の\(\chi^2\)分布であるため、
\begin{eqnarray}
\left(\frac{s(\theta_0)}{\sqrt{I_F(\theta_0)}}\right)^2
&=&
\frac{s(\theta_0)^2}{I_F(\theta_0)} \\ \\
&\sim& \chi^2(1)
\end{eqnarray}
が得られる。
\begin{eqnarray}
R
&=&
\frac{s(\theta_0)^2}{I_F(\theta_0)} \\ \\
&=&
\frac{1}{I_F(\theta_0)}\left(\frac{d}{d\hat{\sigma}^2}\log f(x;\hat{\sigma}^2)\right)^2 \\ \\
&=&
\frac{2\hat{\sigma}^4}{n}\left(\frac{d}{d\hat{\sigma}^2}\log f(x;\hat{\sigma}^2)\right)^2&...&\text{式(4.2.15)} \\ \\
&=&
\frac{2\hat{\sigma}^4}{n}\left(-\frac{1}{2\hat{\sigma}^2}\left(n-\displaystyle\sum_{i=1}^n\left(\frac{x_i}{\hat{\sigma}}\right)^2\right)\right)^2&...&\text{式(4.2.14)より} \\ \\
&=&
\frac{2\hat{\sigma}^4}{n}\frac{1}{4\hat{\sigma}^4}\left(n-\displaystyle\sum_{i=1}^n\left(\frac{x_i}{\hat{\sigma}}\right)^2\right)^2 \\ \\
&=&
\frac{1}{2n}\left(n-\displaystyle\sum_{i=1}^n\left(\frac{x_i}{\hat{\sigma}}\right)^2\right)^2 \\ \\
\end{eqnarray}
が得られる。
\(\S\)4.3 正規分布に関する検定
- p.103上:尤度比の式変形の導出
- p.104上:\(L\)の導出
- p.105上:\(\displaystyle\sum_{i=1}^n(x_i-\overline{x})^2/\sigma_0^2\sim\chi^2(n-1)\)になること
p.102下の尤度比の式より
\begin{eqnarray}
\frac{f(x;\mu_2)}{f(x;\mu_1)}
&=&
\frac{\frac{1}{(2\pi)^{n/2}}\exp\left(-\frac12\sum_{i=1}^n(x_i-\mu_2)^2\right)}{\frac{1}{(2\pi)^{n/2}}\exp\left(-\frac12\sum_{i=1}^n(x_i-\mu_1)^2\right)} \\ \\
&=&
\exp\left(-\frac12\sum_{i=1}^n(x_i-\mu_2)^2\right)\exp\left({\color{red}+}\frac12\sum_{i=1}^n(x_i-\mu_1)^2\right) \\ \\
&=&
\exp\left(-\frac12\left[\sum_{i=1}^n(x_i^2-2x_i\mu_2+\mu_2^2)-\sum_{i=1}^n(x_i^2-2x_i\mu_1+\mu_1^2)\right]\right) \\ \\
&=&
\exp\left(-\frac12\left[\sum_{i=1}^n(x_i^2-x_i^2)-\sum_{i=1}^n2(x_i\mu_2-x_i\mu_1)+\sum_{i=1}^n(\mu_2^2-\mu_1^2)\right]\right) \\ \\
&=&
\exp\left(-\frac12\left[0-n\sum_{i=1}^n2\frac{x_i}{n}(\mu_2-\mu_1)+n(\mu_2^2-\mu_1^2)\right]\right) \\ \\
&=&
\exp\left(-\frac12\left[-2n\overline{x}(\mu_2-\mu_1)+n(\mu_2^2-\mu_1^2)\right]\right) &...&\sum_{i=1}^n2\frac{x_i}{n}=\overline{x}\text{を用いた}\\ \\
&=&
\exp\left(n\overline{x}(\mu_2-\mu_1)-n/2(\mu_2^2-\mu_1^2)\right) \\ \\
&=&
\exp\left(n(\mu_2-\mu_1)T(x)-n/2(\mu_2^2-\mu_1^2)\right)&...&\text{p.103上:}T(x)=\overline{x} \\ \\
\end{eqnarray}
と導出できる。
p.102下の尤度比の式より
\begin{eqnarray}
L
&=&
\frac{\displaystyle\sup_{\Theta_1}f(x;\mu_1,\sigma_1^2)}{\displaystyle\sup_{\Theta_0}f(x;\mu_0,\sigma_0^2)} \\ \\
&=&
\frac{\frac{1}{(2\pi\hat{\sigma}_1^2)^{n/2}}\exp\left(-\frac{n}{2\hat{\sigma}_1^2}\frac{1}{n}\sum_{i=1}^n(x_i-\hat{\mu}_1)^2\right)}{\frac{1}{(2\pi\hat{\sigma}_0^2)^{n/2}}\exp\left(-\frac{n}{2\hat{\sigma}_0^2}\frac{1}{n}\sum_{i=1}^n(x_i-\hat{\mu}_0)^2\right)} \\ \\
&=&
\frac{\frac{1}{(2\pi\hat{\sigma}_1^2)^{n/2}}\exp\left(-\frac{n}{2\hat{\sigma}_1^2}\frac{1}{n}\sum_{i=1}^n(x_i-\overline{x})^2\right)}{\frac{1}{(2\pi\hat{\sigma}_0^2)^{n/2}}\exp\left(-\frac{n}{2\hat{\sigma}_0^2}\frac{1}{n}\sum_{i=1}^n(x_i-\overline{x}_0)^2\right)}&...&\text{p.61の尤度を最大化するパラメータより} \\ \\
&=&
\frac{\frac{1}{(2\pi\hat{\sigma}_1^2)^{n/2}}\exp\left(-\frac{n}{2\hat{\sigma}_1^2}\hat{\sigma}_1^2\right)}{\frac{1}{(2\pi\hat{\sigma}_0^2)^{n/2}}\exp\left(-\frac{n}{2\hat{\sigma}_0^2}\hat{\sigma}_0^2\right)}&...&\text{p.61の尤度を最大化するパラメータより} \\ \\
&=&
\frac{\frac{1}{(2\pi\hat{\sigma}_1^2)^{n/2}}\exp\left(-n\right)}{\frac{1}{(2\pi\hat{\sigma}_0^2)^{n/2}}\exp\left(-n\right)} \\ \\
&=&
\frac{(\hat{\sigma}_0^2)^{n/2}}{(\hat{\sigma}_1^2)^{n/2}} \\ \\
&=&
\frac{\left[\frac{1}{n}\displaystyle\sum_{i=1}^n(x_i-\overline{x}_0)^2\right]^{n/2}}{\left[\frac{1}{n}\displaystyle\sum_{i=1}^n(x_i-\overline{x})^2\right]^{n/2}}&...&\text{p.61の尤度を最大化するパラメータより} \\ \\
&=&
\frac{\frac{1}{n^{n/2}}\left[\displaystyle\sum_{i=1}^n(x_i-\mu_0)^2\right]^{n/2}}{\frac{1}{n^{n/2}}\left[\displaystyle\sum_{i=1}^n(x_i-\overline{x})^2\right]^{n/2}} \\ \\
&=&
\frac{\left[\displaystyle\sum_{i=1}^n(x_i-\mu_0)^2\right]^{n/2}}{\left[\displaystyle\sum_{i=1}^n(x_i-\overline{x})^2\right]^{n/2}} \\ \\
&=&
\left(\frac{\displaystyle\sum_{i=1}^n(x_i-\mu_0)^2}{\displaystyle\sum_{i=1}^n(x_i-\overline{x})^2}\right)^{n/2} \\ \\
\end{eqnarray}
と導出できる。
p.47の定理(2.3.3)より\(\chi^2\)分布になる。
\(\S\)4.4 2つの正規分布に関する検定
- p.106:\(\overline{x}_1-\overline{x}_2\sim z\sqrt{\sigma_1^2/{n_1}+\sigma_2^2/{n_2}}\)になること
- p.106:\(\frac{\overline{x}_1-\overline{x}_2}{\sqrt{(n_1^{-1}+n_2^{-1})V}}\sim t(n-2)\)になること
- p.107:\(\frac{n_2\hat{\sigma}_2^2/(n_2-1)}{n_1\hat{\sigma}_1^2/(n_1-1)}\sim F(n_2-1,n_1-1)\)になること
ここでは、\(\frac{\overline{x}_1-\overline{x}_2}{\sqrt{\sigma_1^2/{n_1}+\sigma_2^2/{n_2}}}\sim N(\mu_1-\mu_2,1)\)であることを示す。
現代数理統計学の基礎やデータ解析のための数理統計入門などから、 \(X\sim N(\mu,\sigma^2)\)に対して、\(aX+b\sim N(a\mu+b,a\sigma^2)\)になることから、 \(\overline{x}_1\sim N(\mu_1,\frac{\sigma_1^2}{n_1}),\overline{x}_2\sim N(\mu_2,\frac{\sigma_2^2}{n_2})\)になる。
ここで、p.38の定理(2.2.1)より正規分布は再生性を持つことから、 \begin{eqnarray} &&\overline{x}_1-\overline{x}_2&\sim& N(\mu_1-\mu_2,\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}) \\ \\ &\Leftrightarrow& \frac{\overline{x}_1-\overline{x}_2}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}&\sim& N(\mu_1-\mu_2,1) \end{eqnarray} になる。
現代数理統計学の基礎やデータ解析のための数理統計入門などから、 \(X\sim N(\mu,\sigma^2)\)に対して、\(aX+b\sim N(a\mu+b,a\sigma^2)\)になることから、 \(\overline{x}_1\sim N(\mu_1,\frac{\sigma_1^2}{n_1}),\overline{x}_2\sim N(\mu_2,\frac{\sigma_2^2}{n_2})\)になる。
ここで、p.38の定理(2.2.1)より正規分布は再生性を持つことから、 \begin{eqnarray} &&\overline{x}_1-\overline{x}_2&\sim& N(\mu_1-\mu_2,\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}) \\ \\ &\Leftrightarrow& \frac{\overline{x}_1-\overline{x}_2}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}&\sim& N(\mu_1-\mu_2,1) \end{eqnarray} になる。
p.48より\(t\)分布は、\(Z\sim N(0,1), W\sim\chi^2(p)\)に対し、\(T=\frac{Z}{\sqrt{W/p}}\)で表されることを用いる。
(I)
「p.106:\(\overline{x}_1-\overline{x}_2\sim z\sqrt{\sigma_1^2/{n_1}+\sigma_2^2/{n_2}}\)になること」より\(\sigma_1=\sigma_2=\sigma\)のときに\(\frac{\overline{x}_1-\overline{x}_2}{\sqrt{\sigma^2/{n_1}+\sigma^2/{n_2}}}\sim N(\mu_1-\mu_2,1)\)であることがわかる。
(II)
p.47定理(2.3.3)とp.46定理(2.3.1)より、 \begin{eqnarray} \displaystyle\sum_{i=1}^{n_1}(x_{1i}-\overline{x}_1)^2/\sigma^2\sim \chi^2(n_1-1)=Ga(\frac{n_1-1}{2},\frac12) \\ \\ \displaystyle\sum_{i=1}^{n_2}(x_{2i}-\overline{x}_2)^2/\sigma^2\sim \chi^2(n_2-1)=Ga(\frac{n_2-1}{2},\frac12) \\ \\ \end{eqnarray} であることかわかり、また、p.39定理(2.2.2)よりガンマ分布(\(\chi^2\)分布)の再生性があるため、 \begin{eqnarray} \displaystyle\sum_{i=1}^{n_1}(x_{1i}-\overline{x}_1)^2/\sigma^2+\displaystyle\sum_{i=1}^{n_2}(x_{2i}-\overline{x}_2)^2/\sigma^2\sim Ga(\frac{n_1-1+n_2-1}{2},\frac12)=\chi^2(n_1+n_2-2) \\ \\ \end{eqnarray} となる。
(I)(II)より \begin{eqnarray} \frac{\frac{\overline{x}_1-\overline{x}_2}{\sqrt{\sigma^2/{n_1}+\sigma^2/{n_2}}}}{\sqrt{\left(\displaystyle\sum_{i=1}^{n_1}(x_{1i}-\overline{x}_1)^2/\sigma^2+\displaystyle\sum_{i=1}^{n_2}(x_{2i}-\overline{x}_2)^2/\sigma^2\right)/(n_1+n_2-2)}}\sim t(n_1+n_2-2) \end{eqnarray} となる。これを書き換えると \begin{eqnarray} &&\frac{\frac{\overline{x}_1-\overline{x}_2}{\sqrt{\sigma^2/{n_1}+\sigma^2/{n_2}}}}{\sqrt{\left(\displaystyle\sum_{i=1}^{n_1}(x_{1i}-\overline{x}_1)^2/\sigma^2+\displaystyle\sum_{i=1}^{n_2}(x_{2i}-\overline{x}_2)^2/\sigma^2\right)/(n_1+n_2-2)}} \\ \\ &=& \frac{\frac{\overline{x}_1-\overline{x}_2}{\sqrt{\sigma^2/{n_1}+\sigma^2/{n_2}}}}{\sqrt{\left(n_1\displaystyle\sum_{i=1}^{n_1}\frac{1}{n_1}(x_{1i}-\overline{x}_1)^2/\sigma^2+n_2\displaystyle\sum_{i=1}^{n_2}\frac{1}{n_2}(x_{2i}-\overline{x}_2)^2/\sigma^2\right)/(n_1+n_2-2)}} \\ \\ &=& \frac{\frac{\overline{x}_1-\overline{x}_2}{\sqrt{\sigma^2/{n_1}+\sigma^2/{n_2}}}}{\sqrt{\left(n_1\hat{\sigma}_1^2/\sigma^2+n_2\hat{\sigma}_2^2/\sigma^2\right)/(n_1+n_2-2)}} \\ \\ &=& \frac{\sigma\frac{\overline{x}_1-\overline{x}_2}{\sqrt{\sigma^2/{n_1}+\sigma^2/{n_2}}}}{\sigma\sqrt{\left(n_1\hat{\sigma}_1^2/\sigma^2+n_2\hat{\sigma}_2^2/\sigma^2\right)/(n-2)}}&...&\text{p.105より}n_1+n_2=n \\ \\ &=& \frac{\frac{\overline{x}_1-\overline{x}_2}{\sqrt{1/{n_1}+1/{n_2}}}}{\sqrt{\left(n_1\hat{\sigma}_1^2+n_2\hat{\sigma}_2^2\right)/(n-2)}}& \\ \\ &=& \frac{\frac{\overline{x}_1-\overline{x}_2}{\sqrt{n_1^{-1}+n_2^{-1}}}}{\sqrt{V}}&...&\text{p.105下より}V=(n_1\hat{\sigma}_1^2+n_2\hat{\sigma}_2^2)/(n-2) \\ \\ &=& \frac{\overline{x}_1-\overline{x}_2}{\sqrt{(n_1^{-1}+n_2^{-1})V}}& \\ \\ \end{eqnarray} と導出できる。
(I)
「p.106:\(\overline{x}_1-\overline{x}_2\sim z\sqrt{\sigma_1^2/{n_1}+\sigma_2^2/{n_2}}\)になること」より\(\sigma_1=\sigma_2=\sigma\)のときに\(\frac{\overline{x}_1-\overline{x}_2}{\sqrt{\sigma^2/{n_1}+\sigma^2/{n_2}}}\sim N(\mu_1-\mu_2,1)\)であることがわかる。
(II)
p.47定理(2.3.3)とp.46定理(2.3.1)より、 \begin{eqnarray} \displaystyle\sum_{i=1}^{n_1}(x_{1i}-\overline{x}_1)^2/\sigma^2\sim \chi^2(n_1-1)=Ga(\frac{n_1-1}{2},\frac12) \\ \\ \displaystyle\sum_{i=1}^{n_2}(x_{2i}-\overline{x}_2)^2/\sigma^2\sim \chi^2(n_2-1)=Ga(\frac{n_2-1}{2},\frac12) \\ \\ \end{eqnarray} であることかわかり、また、p.39定理(2.2.2)よりガンマ分布(\(\chi^2\)分布)の再生性があるため、 \begin{eqnarray} \displaystyle\sum_{i=1}^{n_1}(x_{1i}-\overline{x}_1)^2/\sigma^2+\displaystyle\sum_{i=1}^{n_2}(x_{2i}-\overline{x}_2)^2/\sigma^2\sim Ga(\frac{n_1-1+n_2-1}{2},\frac12)=\chi^2(n_1+n_2-2) \\ \\ \end{eqnarray} となる。
(I)(II)より \begin{eqnarray} \frac{\frac{\overline{x}_1-\overline{x}_2}{\sqrt{\sigma^2/{n_1}+\sigma^2/{n_2}}}}{\sqrt{\left(\displaystyle\sum_{i=1}^{n_1}(x_{1i}-\overline{x}_1)^2/\sigma^2+\displaystyle\sum_{i=1}^{n_2}(x_{2i}-\overline{x}_2)^2/\sigma^2\right)/(n_1+n_2-2)}}\sim t(n_1+n_2-2) \end{eqnarray} となる。これを書き換えると \begin{eqnarray} &&\frac{\frac{\overline{x}_1-\overline{x}_2}{\sqrt{\sigma^2/{n_1}+\sigma^2/{n_2}}}}{\sqrt{\left(\displaystyle\sum_{i=1}^{n_1}(x_{1i}-\overline{x}_1)^2/\sigma^2+\displaystyle\sum_{i=1}^{n_2}(x_{2i}-\overline{x}_2)^2/\sigma^2\right)/(n_1+n_2-2)}} \\ \\ &=& \frac{\frac{\overline{x}_1-\overline{x}_2}{\sqrt{\sigma^2/{n_1}+\sigma^2/{n_2}}}}{\sqrt{\left(n_1\displaystyle\sum_{i=1}^{n_1}\frac{1}{n_1}(x_{1i}-\overline{x}_1)^2/\sigma^2+n_2\displaystyle\sum_{i=1}^{n_2}\frac{1}{n_2}(x_{2i}-\overline{x}_2)^2/\sigma^2\right)/(n_1+n_2-2)}} \\ \\ &=& \frac{\frac{\overline{x}_1-\overline{x}_2}{\sqrt{\sigma^2/{n_1}+\sigma^2/{n_2}}}}{\sqrt{\left(n_1\hat{\sigma}_1^2/\sigma^2+n_2\hat{\sigma}_2^2/\sigma^2\right)/(n_1+n_2-2)}} \\ \\ &=& \frac{\sigma\frac{\overline{x}_1-\overline{x}_2}{\sqrt{\sigma^2/{n_1}+\sigma^2/{n_2}}}}{\sigma\sqrt{\left(n_1\hat{\sigma}_1^2/\sigma^2+n_2\hat{\sigma}_2^2/\sigma^2\right)/(n-2)}}&...&\text{p.105より}n_1+n_2=n \\ \\ &=& \frac{\frac{\overline{x}_1-\overline{x}_2}{\sqrt{1/{n_1}+1/{n_2}}}}{\sqrt{\left(n_1\hat{\sigma}_1^2+n_2\hat{\sigma}_2^2\right)/(n-2)}}& \\ \\ &=& \frac{\frac{\overline{x}_1-\overline{x}_2}{\sqrt{n_1^{-1}+n_2^{-1}}}}{\sqrt{V}}&...&\text{p.105下より}V=(n_1\hat{\sigma}_1^2+n_2\hat{\sigma}_2^2)/(n-2) \\ \\ &=& \frac{\overline{x}_1-\overline{x}_2}{\sqrt{(n_1^{-1}+n_2^{-1})V}}& \\ \\ \end{eqnarray} と導出できる。
p.48より\(F\)分布は、\(U\sim \chi^2(p), V\sim\chi^2(q)\)に対し、\(F=\frac{U/p}{V/q}\)で表されることを用いる。
p.47より、 \begin{eqnarray} \displaystyle\sum_{i=1}^{n_1}(x_{1i}-\overline{x}_1)^2\sim\chi^2(n_1-1) \\ \\ \displaystyle\sum_{i=1}^{n_2}(x_{2i}-\overline{x}_2)^2\sim\chi^2(n_2-1) \\ \\ \end{eqnarray} であることがわかる。これを用いると \begin{eqnarray} \frac{\left(\displaystyle\sum_{i=1}^{n_2}(x_{2i}-\overline{x}_2)^2\right)/(n_2-1)}{\left(\displaystyle\sum_{i=1}^{n_1}(x_{1i}-\overline{x}_1)^2\right)/(n_1-1)}\sim F(n_2-1,n_1-1) \end{eqnarray} となる。これを書き換えると \begin{eqnarray} &&\frac{\left(\displaystyle\sum_{i=1}^{n_2}(x_{2i}-\overline{x}_2)^2\right)/(n_2-1)}{\left(\displaystyle\sum_{i=1}^{n_1}(x_{1i}-\overline{x}_1)^2\right)/(n_1-1)} \\ \\ &=& \frac{n_2\left(\displaystyle\sum_{i=1}^{n_2}\frac{1}{n_2}(x_{2i}-\overline{x}_2)^2\right)/(n_2-1)}{n_1\left(\displaystyle\sum_{i=1}^{n_1}\frac{1}{n_1}(x_{1i}-\overline{x}_1)^2\right)/(n_1-1)} \\ \\ &=& \frac{n_2\hat{\sigma}_2^2/(n_2-1)}{n_1\hat{\sigma}_1^2/(n_1-1)}&...&\text{p.105より} \\ \\ \end{eqnarray} と導出できる。
p.47より、 \begin{eqnarray} \displaystyle\sum_{i=1}^{n_1}(x_{1i}-\overline{x}_1)^2\sim\chi^2(n_1-1) \\ \\ \displaystyle\sum_{i=1}^{n_2}(x_{2i}-\overline{x}_2)^2\sim\chi^2(n_2-1) \\ \\ \end{eqnarray} であることがわかる。これを用いると \begin{eqnarray} \frac{\left(\displaystyle\sum_{i=1}^{n_2}(x_{2i}-\overline{x}_2)^2\right)/(n_2-1)}{\left(\displaystyle\sum_{i=1}^{n_1}(x_{1i}-\overline{x}_1)^2\right)/(n_1-1)}\sim F(n_2-1,n_1-1) \end{eqnarray} となる。これを書き換えると \begin{eqnarray} &&\frac{\left(\displaystyle\sum_{i=1}^{n_2}(x_{2i}-\overline{x}_2)^2\right)/(n_2-1)}{\left(\displaystyle\sum_{i=1}^{n_1}(x_{1i}-\overline{x}_1)^2\right)/(n_1-1)} \\ \\ &=& \frac{n_2\left(\displaystyle\sum_{i=1}^{n_2}\frac{1}{n_2}(x_{2i}-\overline{x}_2)^2\right)/(n_2-1)}{n_1\left(\displaystyle\sum_{i=1}^{n_1}\frac{1}{n_1}(x_{1i}-\overline{x}_1)^2\right)/(n_1-1)} \\ \\ &=& \frac{n_2\hat{\sigma}_2^2/(n_2-1)}{n_1\hat{\sigma}_1^2/(n_1-1)}&...&\text{p.105より} \\ \\ \end{eqnarray} と導出できる。
\(\S\)4.5 正規分布以外の分布に関する検定法
- p.110:\(n_1,n_2\)が十分に大きなときに従う検定の導出
- p.111:\(n\)が十分に大きなときに従うポアソン分布に関する検定の導出
- p.112:適合度検定で\(W\)が\(\chi^2\)分布に従うことの導出
こちらなど参考。
こちらなど参考。
現代数理統計学の基礎など参考。