Herramienta Datos de entrada
Ejemplo de cada herramienta
La herramienta Entrada de datos tiene un ejemplo de uso. Visita Flujos de trabajo de muestra para aprender cómo acceder a este y muchos otros ejemplos directamente en Alteryx Designer.
Utiliza la herramienta Datos de entrada para agregar datos al flujo de trabajo mediante la conexión a un archivo o una base de datos.
Nota
El uso de comodines para leer varios archivos .csv con el sistema de archivos distribuido Hadoop produce un error.
Configurar la herramienta
La ventana de Configuración de la herramienta Entrada de datos tiene dos secciones: Conectar un archivo o una base de datos y Opciones .
Conectar un archivo o una base de datos
En los siguientes pasos, se describe el proceso con el Administrador de conexiones de datos (DCM) desactivado. Cuando está activada, la lista desplegable Conectar un archivo o una base de datos se sustituye por el botón Configurar una conexión que abre la ventana Conexiones de datos , en la que se muestran solo fuentes de datos compatibles con DCM, y se abre DCM cuando se selecciona una tecnología.
Con la herramienta Datos de entrada en el lienzo, sigue estos pasos:
En la ventana de Configuración, selecciona el menu desplegable Conectar un archivo o base de datos .
Designer muestra la ventana Conexiones de datos. Configura la conexión de datos mediante una de estas opciones: Recientes , Guardado , Archivos , Fuentes de datos o Server .
La sección Conexiones recientes contiene archivos y conexiones de datos configurados recientemente. Puedes seleccionar una conexión reciente o seleccionar Borrar lista para eliminar conexiones recientes.
Selecciona una conexión guardada. Para cambiar el nombre y editar las conexiones, usa Administrar conexiones guardadas .
Para conectarse a un archivo en un directorio local o de red, hay cuatro opciones:
En Conexiones de archivos , selecciona Seleccionar archivo para buscar un archivo.
Arrastra un archivo a Conexiones de archivos .
Bajo Todos los tipos de archivos admitidos , selecciona una extensión de tipo de archivo para buscar un archivo de ese tipo.
Cierra Conexiones de datos y arrastra un archivo directamente al lienzo.
Fuentes de datos
En "Fuentes de datos" se muestran las fuentes de datos admitidas y utilizadas con frecuencia.
Herramientas: si seleccionas Conexión rápida para una herramienta que no has instalado, se abre la página de la Comunidad Alteryx para que puedas descargar e instalar esa herramienta. Lee atentamente las instrucciones de la página. Una vez instalada la herramienta, la herramienta Datos de entrada cambia en el lienzo a la herramienta seleccionada en Fuentes de datos.
Fuentes de datos:
ODBC inicia la ventana de conexión ODBC que muestra una lista filtrada de nombres de fuentes de datos en el sistema que usan ese controlador determinado.
OleDB inicia el administrador de oleDB nativo de Windows.
"OCI" inicia el administrador de conexiones OCI de Oracle nativo. Desde aquí, selecciona el Nombre de servicio de red tal como se define en el archivo tnsnames.ora que deseas utilizar para esta conexión, así como las credenciales de nombre de usuario y contraseña.
"Masivo" abre un cuadro de diálogo especial que te permite configurar una conexión masiva para el tipo de conexión seleccionado.
Conexión rápida: para SQL u Oracle, puedes utilizar una conexión guardada preexistente o crear una nueva conexión guardada. Consulta lo siguiente para obtener más información:
Todas las demás conexiones rápidas utilizan otra herramienta.
Server
Server muestra cada Interfaz de usuario de Server y su dirección URL que se haya agregado en el equipo local. Una lista debajo de cada nombre de las instancias de Server contiene las conexiones guardadas almacenadas en el Server al que tienes acceso.
Selecciona + Server para agregar otra conexión de Alteryx Server.
En la ventana Examinar archivo, ingresa un comodín como parte de la ruta de acceso al archivo.
Considera un caso en el que tengas varios archivos de datos con lo siguiente…
La misma cantidad de campos en los que los tipos de datos de cada campo son iguales.
Nombres similares en el mismo directorio.
Nota
Se leen varios archivos utilizando el formato de comodín, como *.csv o 2019*.csv, en una sola herramienta Datos de entrada, siempre que todos los archivos contengan la misma cantidad de campos y que los tipos de datos de cada campo sean iguales. Designer establece el número de campos y el tipo de archivo según el primer archivo leído. Los archivos subsiguientes que no coinciden se omiten y se muestra una advertencia. No es posible controlar qué archivo se lee primero cuando se utiliza una sintaxis comodín como *.csv. El archivo que se designa como primero depende del sistema.
Ingresa el nombre de archivo que los archivos tienen en común y agrega un “*” (asterisco) para reemplazar todos los caracteres siguientes o un “?” para reemplazar un carácter. Incluye la extensión de archivo que todos los archivos tienen en común cuando especifiques los nombres de archivo.
Ejemplo 1
Esta ruta de acceso muestra todos los archivos .csv en el directorio
data\datafiles
con un nombre de archivo que comienza con
ABCD
.
data\datafiles\ABCD*.csv
Muestra
ABCD_4.csv
y
ABCD_012.csv
.
Ejemplo 2
Esta ruta muestra cada archivo .csv contenido en el directorio
data\datafiles
con un nombre de archivo que comienza con
ABCD_ + 1
y tiene un carácter adicional.
data\datafiles\ABCD_?.csv
En Seleccionar entrada de Excel , selecciona una de las entradas de Excel:
Selecciona una hoja para elegir entre las hojas disponibles en el archivo de Excel.
Selecciona un rango (celdas, filas o columnas) : opcionalmente, selecciona un rango de celdas, filas o columnas dentro de la hoja.
Selecciona un rango nombrado para elegir entre los rangos nombrados disponibles en el archivo de Excel.
Importar solo la lista de nombres de hoja para crear resultados con una sola columna que contenga nombres de hoja como valores. Ninguno de los datos relacionados se incluyen en la salida cuando se selecciona esta opción.
Si la hoja de Excel que seleccionas está abierta, se muestra un mensaje de error y no podrás continuar. Cierra la hoja, selecciona Actualizar en el cuadro de diálogo Seleccionar entrada de Excel y finaliza el proceso.
La herramienta Datos de entrada omite las columnas que no están definidas. Una columna definida es aquella que contiene datos o datos previamente borrados por el usuario. Para incluir columnas que no están definidas, especifica un rango mediante la opción Seleccionar un rango (celdas, filas o columnas) del cuadro de diálogo Seleccionar entrada de Excel .
Consulta Soporte para archivos Gzip y Soporte para archivos Zip para obtener más información.
Cuando se selecciona un archivo .gz, .tgz o .zip, se muestra la ventana Seleccionar tipo de archivo que se debe extraer . Utiliza el menú desplegable para seleccionar el tipo de archivos que quieres utilizar.
Seleccionar archivos : marca la casilla situada junto al archivo que quieres extraer.
Para ver todos los archivos del Gzip o Zip, incluso los archivos que no son compatibles con Alteryx, selecciona Otros archivos en Seleccionar el tipo de archivo que se debe extraer . Selecciona un tipo de archivo para Analizar otros archivos como .
Importante
Alteryx Gallery no es compatible con archivos Gzip y Zip.
.cydb | |
.yxdb | |
Alteryx Spatial Zip | .sz |
.avro | |
Valores separados por comas | .csv |
dBase | .dbf |
Base de datos geográficos personal ESRI | .mdb |
ESRI Shapefile | .shp |
Lenguaje de marcado extensible | .xml |
.flat | |
GIS | .grc, .grd |
Google Earth/Google Maps | .kml |
.gz, .tgz | |
IBM SPSS | .sav |
.json | |
Formato de intercambio MapInfo Professional | .mif |
Tabla MapInfo Professional | .tab |
Microsoft Access 2000-2003 | .mdb |
Microsoft Access 2007, 2010, 2013, 2016 | .accdb |
Microsoft Excel Binary | .xlsb |
Microsoft Excel 1997-2003 | .xls |
.xlsx | |
Microsoft Excel habilitado para macros | .xlsm |
QlikView | .qvx |
SAS | .sas7bdat |
SQLite | .sqlite |
SRC Geography | .geo |
Texto | .txt, .asc |
.zip |
Los tipos de archivos desconocidos incluyen cualquier tipo de archivo que Alteryx no pueda leer de forma nativa. Si utilizas una herramienta Datos de entrada para leer un tipo de archivo desconocido, aparecerá la ventana Resolver el tipo de archivo con las siguientes opciones:
Leer como un tipo integrado : selecciona el tipo de archivo que se parece a la estructura del archivo.
Leer como un archivo de texto de ancho fijo : al seleccionar esta opción, puedes asignar columnas mediante una regla deslizante. Ve a Diseño de archivos planos para obtener más información sobre esta opción.
Leer como un archivo de texto delimitado : selecciona esta opción si hay un solo delimitador que indica saltos de columnas en los datos. Selecciona un tipo de delimitador adecuado y, opcionalmente, selecciona si la primera fila contiene nombres de campos en los datos.
Opciones
Selecciona opciones de formato de archivo. Las opciones varían según el archivo o la base de datos a la que te conectes. Ve a Opciones de formato de archivo para obtener más información.
Vista previa del diseño de los datos
Previsualiza el diseño de datos en la ventana de Previsualización . La vista previa del diseño de los datos se limita a 100 registros o menos en archivos anchos. Si los datos contienen 1500 columnas, se muestra al menos un registro y hasta dos filas. Para ver todos los datos, utiliza una herramienta Examinar .
Nombres de columnas duplicados
Si el archivo de entrada contiene varias columnas con el mismo nombre, Designer cambia automáticamente el nombre de las columnas duplicadas según estas reglas:
El nombre duplicado termina en 1 o 9
Si el último carácter del nombre de la columna duplicada es 1 o 9, Designer agrega un guion bajo (_) y un número, a partir del 2, al nombre de la columna duplicada.
Nombre de columna original | Columna duplicada (con el nuevo nombre de Designer) |
---|---|
A1 | A1_2 |
A9 | A9_2 |
El nombre duplicado termina en un dígito entre 2 y 8 (ambos incluidos)
Si el último carácter de la columna duplicada es un dígito entre 2 y 8 (ambos incluidos), Designer incrementa ese dígito para cambiar el nombre de la columna duplicada.
Sin embargo, si el penúltimo carácter es también un dígito, Designer agrega un guion bajo (_) y un número, a partir del 2, al nombre de la columna duplicada.
Nombre de columna original | Columna duplicada (con el nuevo nombre de Designer) |
---|---|
A2 | A3 |
A5 | A6 |
A22 | A22_2 |
El nombre duplicado termina en una letra o un carácter especial
Si el último carácter de la columna duplicada es una letra o un carácter especial, Designer agrega un número (a partir del 2) para cambiar el nombre de la columna duplicada.
Nombre de columna original | Columna duplicada (con el nuevo nombre de Designer) |
---|---|
age | age2 |
registered? | registered?2 |
Nota
El generador de consultas visual no puede mostrar correctamente los caracteres multibyte. En su lugar, utiliza la pestaña Tablas.
Usar el modo clásico
Aviso
El modo clásico no es compatible cuando el administrador de Conexión de datos ( DCM) está activado.
Para usar el modo clásico:
Selecciona Opciones > Configuración de usuario > Editar configuración de usuario .
En la pestaña Valores predeterminados, marca la casilla Usar el modo clásico para el menú de opciones de las herramientas de Entrada/Salida .
Selecciona Guardar .
Selecciona el lienzo o utiliza el atajo de teclado F5 para actualizar.
Ahora puedes utilizar el modo clásico de la herramienta Datos de entrada para seleccionar los archivos y las fuentes de datos.
Convertir una herramienta Datos de salida en una herramienta Datos de entrada
Puedes convertir una herramienta Datos de salida en una herramienta Datos de entrada.
Haz clic derecho en la herramienta Datos de salida que quieres convertir en una herramienta Datos de entrada .
Selecciona Convertir a Datos de entrada .
Los datos de salida se convierten en datos de entrada.