Herramientas de flujo de trabajo para Preparación
Las herramientas de flujo de trabajo para Preparación son compatibles con el muestreo, la limpieza y el filtrado de tus datos en Designer Cloud.
Herramientas de flujo de trabajo para Preparación
Elemento | Descripción |
---|---|
Use Create Sample to split the input records into 2 or 3 random samples. | |
Utiliza la herramienta Limpieza de datos para corregir problemas comunes de calidad de datos. Puedes reemplazar valores nulos, eliminar puntuación, modificar el uso de mayúsculas y minúsculas y mucho más. | |
Utiliza la herramienta Filtro para seleccionar datos utilizando una condición. | |
Utiliza la herramienta Fórmula para crear columnas nuevas, actualizar columnas y usar una o más expresiones para realizar una variedad de cálculos y operaciones. | |
Use Imputation to clean up missing values in your data. | |
Use Multi-Column Binning to tile or bin on multiple columns. | |
Utiliza la herramienta Fórmula de columnas múltiples para crear o actualizar varias columnas con una sola expresión. | |
Use Oversample Column to automatically create balanced samples from imbalanced data for use in statistical modeling. | |
Utiliza la herramienta Muestra porcentual aleatoria para devolver un número esperado de filas que causan una muestra aleatoria del flujo de datos entrante. | |
Utiliza la herramienta Id. de fila para crear una nueva columna en los datos y asignar un identificador único, que aumenta secuencialmente para cada fila de los datos. | |
Utiliza la herramienta Muestra para limitar el flujo de datos a un número, un porcentaje o un conjunto aleatorio de filas especificados. Además, la herramienta Muestra aplica la configuración seleccionada a las columnas por las que quieres agrupar. | |
Utiliza la herramienta Seleccionar para incluir, excluir y reordenar las columnas de datos que pasan por tu flujo de trabajo. | |
Utiliza la herramienta Seleccionar filas para devolver filas y rangos de filas especificados, incluidos los rangos interrumpidos de filas. Esta herramienta es útil para la solución de problemas y el muestreo. | |
Utiliza la herramienta Ordenar para organizar las filas en una tabla en orden alfanumérico según los valores de los campos de datos especificados. | |
Utiliza la herramienta Mosaico para asignar un valor (mosaico) según los rangos en los datos. La herramienta realiza esto según la especificación del usuario de uno de los tres métodos. | |
Utiliza la herramienta Único para distinguir si una fila es única o un duplicado agrupando por una o más columnas especificadas y, luego, ordenando según esas columnas. |