Herramienta Limpieza de datos
Ejemplo de cada herramienta
La herramienta Limpieza de datos tiene un ejemplo de uso. Visita Flujos de trabajo de muestra para aprender cómo acceder a este y muchos otros ejemplos directamente en Alteryx Designer.
Utiliza la herramienta Limpieza de datos para corregir problemas comunes de calidad de datos. Puedes reemplazar valores nulos, eliminar puntuación, modificar el uso de mayúsculas y minúsculas y mucho más.
Limitaciones conocidas
La herramienta Limpieza de datos no es dinámica. Usada en una configuración dinámica, como una macro destinada a trabajar con nombres de campo recién generados, la herramienta no interactúa con los campos, por más que todas las opciones estén seleccionadas. Considera reemplazar la herramienta Limpieza de datos por una herramienta Fórmula multicampo .
Visita la serie de Dominio de herramientas de la Comunidad Alteryx para aprender aún más sobre esta y otras herramientas.
Componentes de la herramienta
La herramienta Limpieza de datos tiene dos anclas:
Ancla de entrada: conecta los datos que quieres limpiar.
Ancla de salida: los datos limpios salen por el ancla de salida.
Configurar la herramienta
Utiliza la pestaña Opciones para determinar cómo se manejan los problemas de calidad de datos.
Eliminar datos nulos
Utiliza estas opciones para eliminar filas y columnas completas de datos nulos.
Quitar filas nulas
Elimina todas las filas con un valor nulo en cada columna.
Elimina filas con valores nulos, no elimina filas con valores de cadena vacíos.
Solo elimina las filas que tienen un valor nulo en cada columna.
Aparece un mensaje en la ventana de Resultados con el número de filas que se eliminaron.
Eliminar columnas nulas
Elimina todas las columnas con un valor nulo en cada fila.
Elimina columnas con valores nulos, no elimina columnas con valores de cadena vacíos.
Solo elimina las columnas que tienen un valor nulo en cada fila.
Aparece un mensaje en la ventana de Resultados con el número de columnas que se eliminaron.
Selecciona campos para limpiar
Selecciona los campos para limpiar con las siguientes opciones de configuración. Haz clic en "Todo" para seleccionar todos los campos y en "Ninguno" para anular la selección de todos los campos
Datos de tipo cadena (String)
Todas las opciones, excepto Reemplazar Nulos con 0, se aplican a tipos de datos de cadena. Para especificar diferentes opciones para diferentes campos, utiliza varias herramientas Limpieza de datos en el flujo de trabajo.
Reemplazar nulos
Para reemplazar nulos por valores que no sean espacios en blanco o 0, utiliza la herramienta Imputación .
Reemplazar con espacios en blanco (campos de cadena) : reemplaza los valores nulos con un valor de cadena en blanco. Un espacio en blanco se registra como " " en vez de nulo [Null]. Esta opción está seleccionada de manera predeterminada.
Reemplazar con 0 (campos numéricos) : reemplaza los valores nulos con un 0 (cero). Esta opción está seleccionada de manera predeterminada.
Eliminar caracteres no deseados
Espacio en blanco inicial y final : elimina los espacios en blanco iniciales y finales. Esta opción está seleccionada de manera predeterminada.
Tabulaciones, saltos de línea y espacios en blanco duplicados : reemplaza cualquier ocurrencia de espacios en blanco con un solo espacio, incluso los finales de línea, tabulaciones, espacios múltiples y otros espacios en blanco consecutivos.
Todos los espacios en blanco : elimina cualquier ocurrencia de espacios en blanco.
Letras : elimina todas las letras, incluso las letras del alfabeto no latino como A b Z À é ö .
Números : elimina todos los números.
Signos de puntuación : elimina los siguientes caracteres:
! " # $ % & ' ( ) * + , \ - . / : ; < = > ? @ [ / ] ^ _ ` { | } ~
Cambiar mayúsculas/minúsculas
Selecciona "Cambiar estilo de mayúsculas y minúsculas" y elije una opción del menú desplegable para cambiar las mayúsculas de los datos de tipo cadena:
Mayúscula : convierte todas las letras de una cadena en mayúsculas.
Minúsculas : convierte todas las letras de una cadena en minúsculas.
Tipo título : pone en mayúscula la primera letra de todas las palabras de una cadena.