フィールドサマリーツール
ツールごとに学習
フィールドサマリーには「ツールごとに学習」があります。サンプルワークフロー を参照して、このサンプルを含むさまざまなサンプルをAlteryx Designerで直接利用する方法をご確認ください。
フィールドサマリーを使用してデータを分析し、選択した列のデータの説明的な統計情報が含まれるサマリーレポートを作成します。このツールを使用して、データに関するインサイトを取得し、適切なデータ管理のアドバイスを受け取ることができます。
このツールでは、数値、文字列、空間、日時のデータがサポートされています。それぞれのデータタイプにユニークな説明的な統計情報が提供されています。データのタイプの詳細については、データ型を参照してください。
ツールの設定
サマリー情報を生成するフィールドを選択する: サマリー情報を生成したいフィールド(列)のチェックボックスをオンにします。
入力データをサンプリングする: レコードのランダムサンプリングをするには、このチェックボックスをオンにします。これにより、データセットが大きい場合に、ワークフローの実行時間を短縮できます。ワークフローを実行するたびに、異なるデータサンプルが表示されます。以下の2つのサンプリングオプションがあります。
Nレコードを無作為抽出: ランダムにサンプリングするレコード数を指定します。
N%のレコードを無作為抽出: ランダムにサンプリングするレコードのパーセントを指定します。
出力の表示
フィールドサマリーツールには3つの出力があります。
Oアンカー: 選択した列の説明的な統計情報と、Remarks(備考)列にデータ管理の推奨事項を含んだAlteryxデータストリーム。
Rアンカー: 列のデータの管理に用いることのできる推奨内容(「備考」を参照)とともに、散布図および選択した列の説明的な統計情報が含まれる静的レポート。レポートを表示するには、閲覧ツールを追加して、R出力に接続します。閲覧ツールを参照してください。
Iアンカー: 列ごとに展開可能なパネルで構成されるインタラクティブなダッシュボード。レポートを表示するには、閲覧ツールを追加して、I出力に接続します。詳細については、閲覧ツールを参照してください。各パネルは、ヒストグラムまたは縦棒グラフと要約統計量で構成されています。
パネルの上にカーソルを乗せると、追加のアイコンが表示されます。
情報アイコンを選択すると、追加の情報が表示されます。
拡大アイコンを選択すると、詳細ビューでレポートが開きます。
グラフのバーの上にカーソルを乗せると、詳細が表示されます。
Select variables to view(表示する変数を選択)をクリックすると、より小さな列のセットに焦点が当たります。
パネルをアルファベット順または欠落値のパーセンテージでソートします。
出力で使用できる記述的な統計は、分析のために選択された列のデータのタイプによって異なります。結果は水平方向にリスト化されます。左から右へスクロールすると、各データタイプの統計情報が表示されます。
数値データ
列に数値データが含まれている場合、以下の統計情報が提供されます。
Min: データの最小値。
Max: データの最大値。
Median: データの中央値。
Std.Dev.: データ内で値がどれくらい分散しているか。
Percent Missing: データの値がNullの割合。
Unique Values: データ内の固有値の数。
Mean: データの平均。
レイアウト: 閲覧ツールを追加し、R出力に接続して統計をビジュアルに表示します。閲覧ツールを参照してください。
Remarks: 利用可能な場合、データを管理するための推奨事項。
文字列データ
列に文字列データが含まれている場合、以下の統計情報が提供されます。
Percent Missing: データの値がNullの割合。
Unique Values: データ内の固有値の数。
Shortest Value: データ内の最短(長さ)文字列値。
Longest Value: データ内の最長(長さ)文字列値。
Min Value Count: 最小値に等しい値の数。
Max Value Count: 最大値に等しい値の数。
Remarks: 利用可能な場合、データを管理するための推奨事項。
空間データ
列に空間データが含まれている場合、以下の統計情報が提供されます:
Percent Missing: データの値がNullの割合。
Object Type: データ内の空間オブジェクトのタイプ(ポイントやポリゴンなど)。
Avg Area (Sq Miles): データ内の値の平均面積(平方マイル)。
Avg Length (Miles): データ内の値の平均長さ(マイル)。
Avg Num Points: ポイントであるデータの値の平均数。
Remarks: 利用可能な場合、データを管理するための推奨事項。
日付/時刻データ
列に日付/時刻データが含まれている場合、以下の統計情報が提供されます。
Percent Missing: データの値がNullの割合。
Unique Values: データ内の固有値の数。
Latest Date: データ内の最新の、または最も将来の日付。
Earliest Date: データ内の最も早い日付。
Interval: データの日付の間隔(月次など)。
Remarks: 利用可能な場合、データを管理するための推奨事項。