分割表ツール
ツールごとに学習
分割表ツールには「ツールごとに学習」があります。サンプルワークフロー を参照して、このサンプルを含むさまざまなサンプルをAlteryx Designerで直接利用する方法をご確認ください。
分割表を使用して、最大4つの変数/フィールドを確認し、それらの相互関係を決定します。分割表ツールは度数分布表ツールと同様の使い方をします。このツールは2つの出力を生成します。データ出力は選択されたフィールド間のすべての値の組み合わせを度数とパーセントの列でリスト化します。レポート出力では、フィールド間の値の組み合わせを示すテーブルが作成され、行および列の追加のパーセンテージも含まれます。
2つのフィールドを分析しているだけであれば、カイ二乗統計量を出力するように選択してレポートに含めることもできます。カイ二乗統計量は、カテゴリ変数の分布が互いに異なるかどうかを調べるために使用されます。
このオプションを正常に実行するには、Rをインストールする必要があります。[オプション] > [予測ツールセットのダウンロード]に移動し、[Alteryxダウンロード&ライセンス]ポータルにサインインして、Rツールで使用するパッケージとRツールをインストールします。予測ツールセットのダウンロードと使用を参照してください。
ツールの設定
カイ二乗統計量を含む: カイ二乗(X2)統計量は、カテゴリ変数の分布が互いに異なるかどうかを調べるために使用されます。このデータはレポート出力に含まれます。変数1と変数2で分析する2つのフィールドを選択します。
カイ二乗統計量を含まない: 2つ以上4つまでフィールドを選択できます。どちらのオプションを選択する場合も、以下のルールが適用されます。
各変数にはユニークな値がある必要があります。値がフィールド全体でユニークでない場合は、エラーが発生します。
以下の特定のフィールドタイプを選択できません: FixedDecimal、フロート、ダブル、日付、時刻、日付時刻、Blob、SpatialObj。整数フィールド型は使用できますが、フィールドが本当にカテゴリ化されている場合にのみ使用できます。
出力の表示
Dアンカー: データ出力には以下のフィールドが含まれます。
名前
説明
InputField_SelectedField1 (2, 3, 4)
入力データの元のフィールド名。
選択したフィールド数によっては、InputField_SelectedField3とInputField_SelectedField4がない場合があり、イタリック体の部分は実際に選択したフィールド名に変わります。
Frequency
所定のフィールド名の入力データに値が存在する回数。
Percent
(度数/合計レコード)* 100
Rアンカー: レポート出力には、選択した各フィールドの分割表が含まれます。
この出力の最初のレコードには、フィールドタイプについての警告が表示されます。選択したフィールドのいずれかが数値データ型に設定されている場合は、警告が表示されます。レポートの残りには、フィールド値の組み合わせごとに分割表が表示されます。テーブルのヘッダーには、ユーザーが選択したフィールドと、表に表示されていないフィールドの値が表示されます。この表には、合計列と度数、パーセント、行パーセントおよび列パーセントの行も表示されます。
カイ二乗統計オプションを選択すると、表の下に以下の値が表示されます。
カイ二乗: 計算されたカイ二乗値。
df: 自由度
p値Rから返される統計値。p値が小さいほど、変数が互いに依存している可能性が高くなります。
Iアンカー: インタラクティブ出力には、一連のドロップダウンオプションを使って表示したい内容をカスタマイズできるチャートが含まれています。