Skip to main content

Distribution Analysis Tool Icon 分布分析ツール

ツールごとに学習

分布分析には、「ツールごとに学習」が用意されています。サンプルワークフロー を参照して、このサンプルを含むさまざまなサンプルをAlteryx Designerで直接利用する方法をご確認ください。

分布分析を使用すると、1つまたは複数の分布を入力データに収め、それらを多くの適合度検定*統計に基づいて比較することができます。これらのテストの結果の統計的有意性(p値)に基づいて、どの分布がデータを最もよく表すかを決定することができます。

分散型分析ツールは、データの全体的な性質を理解し、それを分析する方法を決定する際に役立ちます。例えば、正規分布に適合するデータは、線形回帰に適している可能性がありますが、ガンマ分布データはガンマ回帰ツールによる分析に適している可能性があります。

This tool uses the R tool. Go to Options > Download Predictive Tools and sign in to the Alteryx Downloads and Licenses portal to install R and the packages used by the R tool. Visit Download and Use Predictive Tools.

ツールの設定

構成タブ

[構成]タブを使用して、分布分析の必須コントロールを設定します。

  1. 分析するフィールドを選択する: 入力データから分析するフィールドを選択します。

  2. 比較する分布を選択: 比較する1つ以上の分布を選択します。分布オプションは次のとおりです。

    • 標準: 実数値の確率変数(すなわち、正の値と負の値の両方をとることができる連続確率変数)を表現するために、自然科学と社会科学の両方でしばしば使用される一般的に発生する連続確率分布。

    • 対数正規: 対数が正規分布している確率変数の連続確率分布。この分布は、成長速度やサイズ分布などの自然現象の記述によく適しています。さらに、それは十分に大きな人口における所得分布を記述するためにしばしば使用されます。

    • ワイブル: 指数分布に密接に関連する比較的柔軟な分布。それは、何らかの種類の「故障」率、例えばランダムな機械的故障、死亡率、解約率、機械的摩耗率などを説明するデータで頻繁に見られます。

    • ガンマ: 非整数、非負のより低い値で事例の有意の濃度値を特徴とする一方で、より高い値の妥当な可能性も許容する連続確率分布。ガンマ分布は幅広い用途を持ち、個人ごとに測定された保険金請求の平均サイズなど、ケースごとの総計(または平均)金額を表すデータで一般に見られます。

対数正規、ワイブル、およびガンマ分布は、非負のデータに対してのみ有効です。

サロゲート主キーやナチュラル主キーなどの固有識別子を含む列は、統計分析で使用しないでください。これらの列は予測値がなく、実行時の例外処理を引き起こす可能性があります。

[グラフィックオプション] タブ

[グラフィックオプション]タブを使用して、グラフィカル出力のコントロールを設定します(オプション)。

  • プロットサイズ: グラフのサイズとしてインチまたはセンチメートルを選択し、高さの値を設定します。

  • グラフの解像度: グラフの解像度を 1 インチあたりのドット数で選択します: 1x (96 dpi)2x (192 dpi)3x (288 dpi)

    • 解像度を低くするとファイルサイズが小さくなり、モニターでの表示に最適です。

    • 解像度を高くするとファイルサイズが大きくなり、印刷品質が向上します。

出力の表示

ヒストグラム、テスト結果の基本要約統計量、適合度統計、分布あたりのデータ分位数、および分布パラメータを含む一連のレポートスニペット。

*D'Agostino, R., Stephens, M.A. (1986) Goodness of Fit Techniques。