アヤメのデータまたは「フィッシャーのアヤメ」データセットは多変量データで、サー・ロナルド・エイルマー・フィッシャーによって1936年に紹介されました。このデータセットは多くの分類システムでその仕組みを分かりやすく説明するためによく使われています。このデータセットは3種のアヤメ(Iris setosa, Iris virginica, Iris versicolor)からそれぞれ50サンプルずつ集めたものです。各サンプルは、花弁とがくの長さと幅の計4つの特徴を計測され、センチメートルで記録されています。判別分析を使ってこの4つの特徴をもとに種の判別を行いたいと思います。
ランダムに120行のアヤメのデータを選んで判別分析のモデルを作成します。そして残りの30行を使用してこのモデルの正確度を確認します。
必要なOriginのバージョン: Origin 8.6 SR0以降
Discriminant Analysis Report のタブをクリックします。
正準判別分析のブランチは、判別分析のためのモデルの関数を作成します。
モデル検証は、判別分析分類子の安定性を保証するために使用できます。
モデル検証を行うには2つの方法があります。
データをランダムに並べ直し、始めの120行をトレーニングデータとします。そして、最後の30行をテストデータとします。
このチュートリアルと同じ結果を得るには、Samplesフォルダ内にあるTutorial Data.opjを開き、プロジェクトエクスプローラでDiscriminant Analysis (Pro Only)サブフォルダを開きます。その中にあるFisher’s Iris Dataワークシートの列Fのデータを使用します。
判別分析はグループメンバーシップの事前確率は同一であると仮定しています。もしグループ集団数が等しくない場合、事前確率は変わってくるかもしれません。この場合、事前確率オプションでグループサイズに比例を選択します。