データの分布モデルを知ることは正しい解析を行っているのか確認する際に役立ちます。分布フィットツールは、ユーザの手元にあるデータの分布を確認し、分布のパラメータを推定します。
このチュートリアルでは、以下の項目について説明します。
建築業者の人が次年度に何軒の家を新築するべきか、近隣地域の家の売り上げデータを元に、設定しようとしています。ユーザが知りたいことは以下の通りです。
この問題を解くためには、不動産屋は次のことを調べる必要があります。
フィットモデルは以下の分布フィットの結果を元に比較します。
確率プロットとフィットの良さ検定より、対数正規分布とガンマ分布はこのデータに対してはどちらもよい分布であるといえます。ここでは、対数正規(lognormal)分布を選択してこの後の例題を進めていきます。
最も良い分布モデルが決定したら、CDF と INV関数を使用して次の確率を計算できます。
logncdf(80, 3.94262, 0.35614) =
logncdf(80, 3.94262, 0.35614) = 0.89136185728793
logninv(1-0.6, 3.94262, 0.35614) =
logninv(1-0.6, 3.94262, 0.35614) = 47.105650533425
上記の分布フィットを選択するセクションで対数正規分布を選択したので logncdf と logninv を使用して推定を実行しました。ガンマを選択している場合、 gamcdf と gaminv を使用します。ガンマでも、似たような結果を得ることができます。