準備

フィールドタイプを、列内に含まれるデータに対して可能な限り最小サイズに設定します。

入力レコードを 2 つまたは 3 つのランダムサンプルに分割します。
![]() |
null値の置換、句読点の削除、大文字の変換などを行うことができます。
ヒント
データクレンズProは、AMP Engineからのみ使用できます。

null や不要な文字など、一般的なデータ品質の問題を修正します。大文字/小文字の変換

フィルターツールを使用して、条件を使用してデータを選択します。条件を満たすデータ行は、Trueアンカーに出力されます。

フォーミュラツールは、式を使用して列を作成および更新します。

行生成ツールは、レコードレベルで新しいデータのセットを作成します。

インピュテーションツールを使用すると、数値データフィールド内の値を置き換えることができます。

このツールを使用すると、複数のフィールドを使ってタイル作成やビン分割ができます。

複数フィールドフォーミュラツールは、1つの式を使用して複数フィールドの作成や更新ができます。

このツールでは、行データを使用してフォーミュラを作成することにより、式を使用して列を作成および更新します。

このツールにより、負の反応が多いデータを正規化することができます。

入力データストリームのランダムサンプルを返します。
![]() |
さらなる処理や出力のためにデータを並べ替えます。

レコードIDは、データ内に新しい列を作成し、データ内の各行に順番に増加する固有識別子を割り当てます。

このツールは、指定した数、パーセンテージ、またはランダムな行セットにデータストリームを制限します。

このツールは、指定されたレコードとレコードの範囲を返します。

セレクトツールは、ワークフローを通過するデータの列を含んだり、除外したり、並べ替えたりすることができます。

ソートツールを使用して、指定されたデータ列の値に基づいて、テーブル内の行を英数字順に整列します。

このツールは、ユーザー指定の方法を使用して、データの範囲に基づいて値(タイル)を割り当てます。

このツールは、指定したフィールドに基づいて、データレコードが固有であるか、重複しているかを区別します。