一元配置ANOVA


Video Image.png Video Text Image.png Website blog icon circle.png Blog Image 33x33px.png

概要

統計では主にインデックスと素データの2つの入力データモードがあります。 通常、分析を実行するときにデータセットすべてを使用する必要はありません。そのためにOriginはデータを選択する方法をいくつか提供しています。 例えば、インタラクティブなデータセレクタボタンを使用して、グラフ上でデータを選択したり、「列ブラウザ」ダイアログを使ってデータを選択できます。

このチュートリアルでは、分散分析(ANOVA)統計検定を使って、これら2つの入力データモードを使って分析を実行する方法を学習します。

ANOVAは、いくつかのグループの平均を比較するパラメトリック検定のひとつで、t検定を拡張したものです。 比較する集団が2つ以上ある場合には、t検定は適さないのでANOVA を使用します。例えば、5つのグループ間の平均をt検定で比較すると、対ごとにt検定を行います。それぞれに対して有意水準0.05で分析を行うため、誤って帰無仮説を棄却する確率確率(タイプ I エラーの確率)は1-(1-0.05)^10=0.401となってしまいます。 同じ条件でも、ANOVAを用いるとタイプ I エラーを犯す確率を0.05におさえることができます。

ANOVAは正規性と等分散を必要とします。 それ以外の場合、ノンンパラメトリック検定を使用します。

必要なOriginのバージョン:Origin 2016 SR0以降

学習する項目

このチュートリアルでは、以下の項目について説明します。

  • 統計分析ダイアログで異なる入力データモードを使用する方法
  • 正規性の検定を実行する
  • 一元配置の分散分析を実行

ステップ

Originは、インデックスとデータの2つのモードでANOVAを計算することができます。

インデックスモードを使うときには、因子とデータの2列でデータが構成されている必要があります。

Tutorial ANOVA 008.png

素データモードで行う場合、異なるレベルは異なる列に入力します。

Tutorial ANOVA 009.png


インデックスモード

4種類の植物の窒素の含有量がミリグラム単位で記録されており、 植物の種類によって窒素の含有量が異なるかどうかを調査します。 このサンプルに対しては、インデックスモードで一元配置ANOVAを実行します。

  1. 新しいワークブックを開き、ヘルプ: フォルダを開く: サンプルフォルダを選択して、サンプルフォルダを開きます。このフォルダ内のStatisticsサブフォルダにあるnitrogen.txt ファイルを探します。空のワークシートにファイルをドラッグアンドドロップしてインポートします。
  2. 最初に、データの各グループに対して正規性の検定を実行し、正規分布に従うかを調べます。ワークブックの一列目を選択し、メインメニューのワークシート:ソート(ワークシート):昇順を選択します。
  3. メインメニューの統計:記述統計:正規性検定を選択し、ダイアログを開きます。 正規性検定ダイアログで、入力ノードの範囲1ノードを開きます。データ範囲の右にある矢印ボタンをクリックしてコンテキストメニューを表示し、B(Y): nitrogenを選択します。同様に、グループ範囲でもコンテキストメニューからA(X): plantを選択します。OKをクリックします。
  4. DOC-2411 ANOVAn1a Magenta.png

  5. ワークシートnitrogen をアクティブにして、メインメニューの統計:ANOVA:一元配置と選択します。ANOVAOneWayダイアログで、入力データモードをインデックスにします。 因子の右にある矢印ボタンをクリックし、コンテキストメニューでA(X): plant 列を選択し、同様にデータのコンテキストメニューから B(Y): nitrogen列を選択します。
  6. DOC-2411 ANOVA03a Magenta.png
  7. 平均の比較タブを開き、Tukeyにチェックをつけます。等分散性の検定ブランチでは、Leveneにチェックを付けます。検出力解析では実際の検出力にチェックをつけ、プロットノードを開き、平均値プロット(SEをエラーバー表示)平均比較プロットにチェックを付けます。 OKをクリックします。
DOC-2411 ANOVA03b Magenta.png

結果の解釈

  • レポートシートANOVA1Wayにある「等分散性の検定」ノードで結果表を確認します。(ノードを開くと表が表示されます)p値が0.05より大きいので、4つの集団が等分散していることが分かります。
ANOVA04.png
  • 全般ANOVA表から、4つのグループのうち少なくとも2つは、p値が0.05より小さいので有意差があると結論付けできます。

ANOVA05.png

  • より詳しい調査を行うには、「平均比較」ノードを開きます。
ANOVA06.png

  • PLANT4の平均が他の3種類とは大きく異なることが分かります。平均値プロット平均比較プロットから、PLANT4は他の3つのグループと異なり、最も小さい平均をもつことがわかります。
ANOVA07.png
ANOVA09.png
  • パワー表で、実際のパワー=0.99976であることからタイプ II エラーの確率はほぼ0であることがわかります。
ANOVA10.png

素データモード

  1. 新しいワークブックを開き、ヘルプ: フォルダを開く: サンプルフォルダを選択して、サンプルフォルダを開きます。このフォルダ内のStatisticsサブフォルダにあるnitrogen_raw.dat ファイルを探します。空のワークシートにファイルをドラッグアンドドロップしてインポートします。
  2. 統計:ANOVA:一元配置を選択します。
  3. 入力タブで、入力データ素データ値とし、レベルの数4にします。
  4. データの右側にある参照ボタンANOVA inpurt data browse.pngをクリックして、ワークシートから選択するを選びます。ダイアログが縮小します。
  5. 4列全て(Plant1, Plant2, Plant3, Plant4)を選択して、ダイアログで完了ボタンをクリックします。OK をクリックしてANOVAを実行します。
  6. 得られた分析結果を分析すると、インデックスデータモードを使用した時と同様の結論が得られたことがわかります。


DOC-2411 ANOVA311a.png

レベル名自動に設定しておくと、選択された列のロングネームが自動的に表示されます。