データヘルス
データヘルスを使用して、データの健全性を確認します。このツールは、特徴量構築ツールや特徴量データ型ツールなどの特徴量エンジニアリングツールと併用することで、データの健全性を高めることができます。データの健全性を判断するために、このツールで欠落値、外れ値、スパース性を分析します。
Alteryx Intelligence Suiteが必要です
このツールは Alteryx Intelligence Suite の一部です。Intelligence Suite を使用するには、Designerに加え、別途のライセンスとアドオンインストーラーが必要です。Designerをインストール後、Intelligence Suiteをインストールし、 無料トライアルを開始 します。
ツールコンポーネント
データヘルスツールには 4 つのアンカーがあります。
入力アンカー: 入力アンカーは、健全性を確認したいデータに接続します。
S 出力アンカー: S 出力アンカーは、各列に関連付けられているデータの健全性スコアをダウンストリームに渡します。
R 出力アンカー: R 出力アンカーは、データの健全性に関する包括的なレポートをダウンストリームに渡します。閲覧ツールを使用してレポートを表示できます。
O 出力アンカー: O 出力アンカーは、データの外れ値をダウンストリームに渡します。
ツールの設定
データヘルスツールを使用するには、データの健全性をスコアリングするために使用するスケール、出力でデータの健全性を高めるための推奨を含めるかどうかのオプションを設定する必要があります。
重要
このツールを使用するには、上流からの入力データが少なくとも 30 行必要です。
1. スケール
ドロップダウンから、スコアをパーセントスケール (0 - 100%) で出力するか、正規化スケール (0 - 1) で出力するかを選択します。スコアは、欠落値、外れ値、スパース性を評価して生成されます。
2. スコアに基づくアドバイスの出力
得られたスコアに基づいて、ツールにデータの健全性を高める方法を提案させたい場合は、このチェックボックスをオンにします。推奨案は、データセットの追加列として表示されます。