Skip to main content

Herramientas de flujo de trabajo para Preparación

Las herramientas de flujo de trabajo para Preparación son compatibles con el muestreo, la limpieza y el filtrado de tus datos en Designer Cloud.

Herramientas de flujo de trabajo para Preparación

Elemento

Descripción

Create Samples Tool

Use Create Sample to split the input records into 2 or 3 random samples.

Herramienta Limpieza de datos

Utiliza la herramienta Limpieza de datos para corregir problemas comunes de calidad de datos. Puedes reemplazar valores nulos, eliminar puntuación, modificar el uso de mayúsculas y minúsculas y mucho más.

Herramienta Filtro

Utiliza la herramienta Filtro para seleccionar datos utilizando una condición.

Herramienta Fórmula

Utiliza la herramienta Fórmula para crear columnas nuevas, actualizar columnas y usar una o más expresiones para realizar una variedad de cálculos y operaciones.

Imputation Tool

Use Imputation to clean up missing values in your data.

Multi-Column Binning Tool

Use Multi-Column Binning to tile or bin on multiple columns.

Herramienta Fórmula de columnas múltiples

Utiliza la herramienta Fórmula de columnas múltiples para crear o actualizar varias columnas con una sola expresión.

Oversample Column Tool

Use Oversample Column to automatically create balanced samples from imbalanced data for use in statistical modeling.

Herramienta Muestra porcentual aleatoria

Utiliza la herramienta Muestra porcentual aleatoria para devolver un número esperado de filas que causan una muestra aleatoria del flujo de datos entrante.

Herramienta Id. de fila

Utiliza la herramienta Id. de fila para crear una nueva columna en los datos y asignar un identificador único, que aumenta secuencialmente para cada fila de los datos.

Herramienta Muestra

Utiliza la herramienta Muestra para limitar el flujo de datos a un número, un porcentaje o un conjunto aleatorio de filas especificados. Además, la herramienta Muestra aplica la configuración seleccionada a las columnas por las que quieres agrupar.

Herramienta Muestra

Utiliza la herramienta Seleccionar para incluir, excluir y reordenar las columnas de datos que pasan por tu flujo de trabajo.

Herramienta Seleccionar filas

Utiliza la herramienta Seleccionar filas para devolver filas y rangos de filas especificados, incluidos los rangos interrumpidos de filas. Esta herramienta es útil para la solución de problemas y el muestreo.

Herramienta Ordenar

Utiliza la herramienta Ordenar para organizar las filas en una tabla en orden alfanumérico según los valores de los campos de datos especificados.

Herramienta Mosaico

Utiliza la herramienta Mosaico para asignar un valor (mosaico) según los rangos en los datos. La herramienta realiza esto según la especificación del usuario de uno de los tres métodos.

Herramienta Único

Utiliza la herramienta Único para distinguir si una fila es única o un duplicado agrupando por una o más columnas especificadas y, luego, ordenando según esas columnas.