Skip to main content

Outils de préparation des données de workflow

Les outils de préparation des données de workflow prennent en charge l'échantillonnage, le nettoyage et le filtrage de vos données dans Designer Cloud.

Outils de préparation des données de workflow

Élément

Description

Auto Column Tool

Use Auto Column to automatically change the column type and size for efficient storage of string data.

Create Samples Tool

Use Create Sample to split the input records into 2 or 3 random samples.

Outil Nettoyage des données

Utilisez l'outil Nettoyage des données pour corriger les problèmes courants de qualité des données. Vous pouvez remplacer les valeurs nulles, supprimer la ponctuation, modifier la mise en majuscules et bien plus encore.

Outil Filtrer

Utilisez l'outil Filtrer pour sélectionner des données en utilisant une condition.

Outil Formule

Utilisez l'outil Formule pour créer de nouvelles colonnes, mettre à jour des colonnes et utiliser une ou plusieurs expressions pour effectuer divers calculs et opérations.

Generate Rows Tool

Use Generate Rows to create new rows of data with an expression.

Imputation Tool

Use Imputation to clean up missing values in your data.

Multi-Column Binning Tool

Use Multi-Column Binning to tile or bin on multiple columns.

Outil Formule à plusieurs colonnes

Utilisez l'outil Formule à plusieurs colonnes pour créer ou mettre à jour plusieurs colonnes à l'aide d'une expression unique.

Multi-Row Formula Tool

Use Multi-Row Formula to create and update columns by using row data to create formulas.

Oversample Column Tool

Use Oversample Column to automatically create balanced samples from imbalanced data for use in statistical modeling.

Outil Échantillon % aléatoire

Utilisez l'outil Échantillon % aléatoire pour renvoyer un nombre attendu de lignes qui génère un échantillon aléatoire du flux de données entrant.

Outil ID de ligne

Utilisez l'outil ID de ligne pour créer une nouvelle colonne dans les données et attribuer un identifiant unique, qui s'incrémente séquentiellement pour chaque ligne des données.

Outil Échantillon

Utilisez l'outil Échantillon pour limiter le flux de données à un nombre spécifié, un pourcentage ou un ensemble aléatoire de lignes. De plus, l'outil Échantillon applique la configuration sélectionnée aux colonnes que vous souhaitez regrouper.

Outil Échantillon

Utilisez l'outil Sélectionner pour inclure, exclure et réorganiser les colonnes de données qui transitent par votre workflow.

Outil Sélectionner des lignes

Utilisez l'outil Sélectionner des lignes pour renvoyer les lignes et les plages de lignes spécifiées, y compris les plages de lignes non continues. Cet outil est utile pour la résolution des problèmes et l'échantillonnage.

Outil Trier

Utilisez l'outil Trier pour réorganiser les lignes d'une table dans l'ordre alphanumérique, en fonction des valeurs des champs de données spécifiés.

Outil Ensemble

Utilisez l'outil Ensemble pour attribuer une valeur (ensemble) basée sur des plages dans les données. Pour ce faire, l'outil se base sur l'une des trois méthodes spécifiées par l'utilisateur.

Outil Unique

Utilisez l'outil Unique pour distinguer si une ligne est unique ou un doublon en regroupant une ou plusieurs colonnes spécifiées, puis en triant ces colonnes.