アルゴリズム(繰り返し測定のある分散分析)

内容


繰り返しのある一元配置/二元配置

一元配置、二元配置のバランスのとれた繰り返し測定のある分散分析のアルゴリズムは、Repeated Measures ANOVA.pdfを確認してください。

二元配置混合モデル

多変量解析

モデルの考え:被験者要因Aと他の被験者要因Bの二元配置混合モデルのRM ANOVA

k を因子Aのレベル数、pを因子Bのレベル数、n_i を因子Aのレベルiの被験者数、y_{ij}^{T} = (y_{ij1},...,y_{ijp})をj番目の被験者と因子Aのレベルiの観測とします。

誤差行列を次のように定義します:E = \sum_{i=1}^{k}\sum_{j=1}^{n_i}(y_{ij}-\bar{y_{i.}})(y_{ij}-\bar{y_{i.}})^{T}, 仮説行列は:H = \sum_{i=1}^{k}n_i(\bar{y_{i.}}-\bar{y_{..}})(\bar{y_{i.}}-\bar{y_{..}})^{T}, 遮断の仮設行列は: H_{int} = \frac{1}{\sum_{i=1}^{k}\frac{1}{n_i}}(\sum_{i=1}^{k}\frac{y_{i.}}{n_i})(\sum_{i=1}^{k}\frac{y_{i.}}{n_i})^{T},

ここで

y_{i.} = \sum_{j=1}^{n_i}y_{ij}, y_{..} = \sum_{i=1}^{k}\sum_{j=1}^{n_i}y_{ij}, \bar{y_{i.}} = \frac{y_{i.}}{n_i}, \bar{y_{..}} = \frac{y_{..}}{N} および N = \sum_{i=1}^{k}n_i.

自由度はd_E = N-kおよびd_H = k-1で計算されます。

因子Aのレベル平均のベクトルを\mu_1,...,\mu_kとし、\bar{\mu_.} = \frac{1}{k}\sum_{i=1}^{k}\mu_i.とします。

因子B中の主な効果

対比行列は


B_{(p-1)\times p}=\begin{bmatrix}
1 & -1 & \cdots & 0 & 0\\ 
0 & 1 & \cdots & 0 & 0\\ 
\vdots & \vdots & \ddots & \vdots & \vdots\\ 
0 & 0 & \cdots & 1 & -1
\end{bmatrix}.

H_0: B\bar{\mu_.}を検定するために、Wilks' Lambda, Hotelling-Lawley Trace, Pillai's Trace, Roy's Largest Rootを計算できます。The SS&CPs are:

S_H = BH_{int}B^{T},S_E = BEB^{T}.

Note:全ての二乗和がタイプⅢをベースにして計算されます。

B*Aの交互作用効果

帰無仮説は H_0: B\mu_1 = B\mu_2 = \cdots = B\mu_k = 0. SS&CPs は:

S_H = BHB^{T},S_E = BEB^{T}.

Mauchlyの球面性検定

計画行列は


X = \begin{bmatrix}
1_{n_1\times 1} & 1_{n_1\times 1} &  &  & \\ 
1_{n_2\times 1} &  & 1_{n_2\times 1} &  & \\ 
\vdots &  &  & \ddots & \\ 
1_{n_k\times 1} &  &  &  & 1_{n_k\times 1}
\end{bmatrix}.

残差行列はR = Y - X\left( (X^TX)^{-1}XY \right).で生成されます。

Mを、次のようにセットできる(p-1)\times pの直行行列とします。


M = \begin{bmatrix}
p-1 & -1 & \cdots & -1 & -1 \\ 
0 & p-2 & \cdots & -1 & -1 \\ 
\vdots & \vdots & \ddots & \vdots & \vdots \\ 
0 & 0 & \cdots & 1 & -1
\end{bmatrix}.

T = M(R^TR)M^T.のようにします。

d=p-1, \tau=\frac{2d^2+d+2}{6d}-N-r_X, \varsigma  = \frac{(d+2)(d-1)(d-2)(2d^3+6d^2+3d+2)}{288d^2\tau^2}. ここで r_X = rank(X).

Mauchly's W統計は

W = \frac{det(T)}{(tr(T)/d)^d}.

カイ二乗検定値は、自由度df = d(d+1)/2-1.\chi^2 = \ln(W)\tauです。

  • Greenhouse-Geisser

\varepsilon_{gg}  = \frac{tr(T)^2}{tr(T^TT)d}.

  • Huynh-Feldt

\varepsilon_{hf}  = \min\left( \frac{nd\varepsilon_{gg}-2}{d(N-r_X)-d^2\varepsilon_{gg}} , 1\right).

  • 下限

\varepsilon_{lb}  = \frac{1}{d}.

  • Roy's Largest Root

Within と Between 検定

基本的な計算

  • 合計の二乗和

SS_T = \sum_{i,k,j}(y_{ikj}-\bar{y_{...}})^2, 自由度 df = Np-1.

  • 因子A間の二乗和

SS_A = \sum_{i,k,j}(\bar{y_{ik.}}-\bar{y_{...}})^2, 自由度 df = N-1.

  • 因子B内の二乗和

SS_B = \sum_{i,k,j}(y_{ikj}-\bar{y_{ik.}})^2, 自由度 df = Np-N.

ここで

\bar{y_{i..}} = \frac{1}{n_ip}\sum_{k,j}y_{ikj}, \bar{y_{...}} = \frac{1}{Np}\sum_{i,k,j}y_{ikj}, \bar{y_{..j}} = \frac{1}{N}\sum_{i,k}y_{ikj}, \bar{y_{i.j}} = \frac{1}{n_i}\sum_{k}y_{ikj}, \bar{y_{ik.}} = \frac{1}{p}\sum_{j}y_{ikj}, N = \sum_{i=1^{k}}n_i .

被験者内要因の検定

  • 検定内の因子Bの二乗和

SSW_B = \sum_{i,k,j}(\bar{y_{..j}}-\bar{y_{...}})^2, 自由度 df = p-1.

  • 検定内のA*B交互の二乗和

SSW_{AB} = \sum_{i,k,j}(\bar{y_{i.j}}-\bar{y_{i..}} - \bar{y_{..j}} + \bar{y_{...}})^2, 自由度 df = (k-1)(p-1).

  • 検定内の誤差(因子B)の二乗和

SSW_{E} = \sum_{i,k,j}(y_{ikj}-\bar{y_{i.j}} - \bar{y_{ik.}} + \bar{y_{i..}})^2, 自由度 df = (N-k)(p-1).

被験者間要因の検定

  • 検定間の切片の二乗和

SSB_{int1} = \frac{p}{\sum_{i=1}^{k}\frac{1}{n_i}}\left( \sum_{i}\sum_{k}\frac{\bar{y_{ik.}}}{n_i}  \right)^2   , 自由度 df = k-1.

  • 検定間の切片の二乗和(切片が0の時)

SSB_{int0} = (X_{A}^{T}X_{A})^{-1}X_{A}^{T}Y , 自由度 df = k-1. ここで X_A は影響Aに関連した計画行列で、Y はインデックスデータを代理する行列 Np \times 1です。

  • 検定間の因子A間の二乗和

SSB_B = \sum_{i,k,j}(\bar{y_{i..}}-\bar{y_{...}})^2, 自由度 df = k-1.

  • 検定間の誤差(因子A)の二乗和

SSB_E = \sum_{i,k,j}(\bar{y_{ik.}}-\bar{y_{i..}})^2, 自由度 df = N-k.

複数の平均比較

Originでは、平均比較にさまざまな方法があり、これはocstat_dlsm_mean_comparison() 関数を使って行っています。

複数の平均の比較法の2種類がOriginに含まれています。

シングルステップ法これは、Tukey-Kramer, Bonferroni, Dunn-Sidak, Fisher’s LSD, Schefféを含む、平均がどの程度違うのかを示すために信頼区間を作成します。

ステップワイズ法Holm-Bonferroni 、Holm-Sidak 検定を含む仮説検定を実行します。