Herramienta RegEx
Utiliza la herramienta RegEx a fin de emplear la sintaxis de expresiones regulares para analizar, coincidir o reemplazar datos.
Sugerencia
Esta herramienta tiene un ejemplo de uso. Visita Acceder a flujos de trabajo de muestra para aprender cómo acceder a este y muchos otros ejemplos directamente en Designer Cloud.
Compatibilidad de RegEx
Aunque se admiten expresiones regulares en Designer Cloud, los usuarios son responsables de sus propias expresiones y de cómo estas afectan a sus datos.
Para obtener más recursos sobre cómo escribir expresiones regulares, visita https://regex101.com/ , un sitio no afiliado a Alteryx, o RegEx Coach, una aplicación gráfica no afiliada para Windows que puedes utilizar para experimentar con expresiones regulares (compatibles con Perl) de forma interactiva.
Para obtener información adicional sobre Boost RegEx, visita estos recursos:
Configurar la herramienta
Selecciona Columna para analizar .
Ingresa tu Expresión regular . Utiliza el botón de signo más para ver expresiones regulares comunes. Encuentra más información en el sitio web Sintaxis de expresiones regulares de Perl .
Marca Distinguir entre mayúsculas y minúsculas para que las búsquedas distingan entre mayúsculas y minúsculas.
Selecciona el Método de salida que se utilizará al analizar y, luego, configura las propiedades relacionadas.
Coincidencia : agrega una columna que contenga un número: 1 si la expresión coincidió, 0 si no lo hizo.
Nombre de columna con estado de coincidencia : proporciona un nombre para la columna agregada.
Analizar : separa la expresión en nuevas columnas y define el Nombre y Tipo de las nuevas columnas. Se crea una nueva columna en la tabla Columnas de salida con estos parámetros:
Nombre : selecciona el nombre de la columna para ingresar un nuevo nombre.
Tipo : utiliza el menú desplegable para seleccionar el nuevo tipo de datos.
Expresión : se rellena automáticamente.
Reemplazar : reemplaza la expresión que buscaste con una segunda expresión.
Reemplazar por : ingresa una expresión para reemplazar la expresión regular original al identificar el grupo marcado con el que se reemplazará la expresión. Utiliza el botón de signo más para ver expresiones regulares comunes.
Marca Copiar texto no coincidente en la salida para copiar el texto no coincidente en la salida.
Tokenizar : divide los datos entrantes mediante una expresión regular. Esta opción funciona de forma similar a la herramienta Texto a columnas , excepto que en lugar de hacer coincidir y quitar lo que no deseas, haces coincidir lo que deseas conservar. Si quieres que la coincidencia se aplique a todo el token, y si tienes un grupo marcado, solo se mostrará esa parte. Ve a Ejemplos del método Tokenizar a continuación.
Dividir en columnas : divide una sola columna de datos en cada instancia del delimitador especificado en varias columnas.
Cantidad de columnas de salida : define cuántas columnas se crean.
Encabezado de columna de salida : introduce el nombre de las columnas recién generadas en las que deben basarse. Las nuevas columnas se denominan con el nombre de la raíz y un número entero anexado que aumenta en serie.
Si hay columnas adicionales en la salida : selecciona el comportamiento que se aplica a las columnas adicionales.
No incluir : los datos que se extienden más allá de la división se descartan y no se genera ninguna advertencia.
No incluir y mostrar advertencia : los datos que se extienden más allá de la división se descartan y se genera una advertencia que indica que hubo información sobrante.
Error (detener el procesamiento de datos) : los datos que se extienden más allá de la división causan un error, y deja de procesarse el flujo de trabajo.
Dividir en filas : divide una sola columna de datos en cada instancia del delimitador especificado en varias filas. Utiliza una columna clave en tu registro para que no pierdas noción de qué valor proviene de qué fila.
Ejemplos del método Tokenizar
Estos casos prácticos se basan en el método Tokenizar de la herramienta RegEx.
Dividir una cadena de 9 caracteres
123456789
en 3 campos. La expresión regular es...
.Analizar una cadena de 9 caracteres en 3 campos, y se muestra solo el segundo carácter. La expresión regular es
.(.).
.Analizar un campo con el delimitador Ctrl-A . La expresión regular para tokenizar una cadena delimitada por Ctrl-A es
[^\cA]+
.[^...]
Los corchetes especifican una coincidencia con un solo carácter en un conjunto de caracteres. Al iniciar el conjunto con^
, se cambia para que coincida con cualquier carácter que no esté en el conjunto.\cA
Esto simplemente coincide con el carácter Ctrl-A .+
Esto significa coincidir con 1 o más del anterior.
Permitir que tokens en blanco conserven entradas:
abc, ,def
. La expresión regular es([^,]*) (?:,|$)
.(...)
El paréntesis crea un grupo marcado de la expresión. El modo Tokenizar te permite hacer coincidir una parte más grande del campo de entrada, pero solo devuelve un subconjunto marcado. De esta manera, evitarás que se devuelva el delimitador. Solo puedes tener una expresión marcada.[^,]
Al iniciar el conjunto con^
, se cambia para que coincida con cualquier carácter que no esté en el conjunto, en este caso una,
.*
coincide con 0 o más del anterior, lo que crea un conjunto vacío. No puedes terminar aquí porque el motor de RegEx no admite una coincidencia de 0 caracteres, ya que hay un número infinito de coincidencias. Por lo tanto, debemos terminar la coincidencia de otra manera.(?:....)
es un grupo sin marcar. Necesitamos esto para elo
para el cual usamos un|
.|
coincide con lo que viene antes o después, pero no con ambos. Eso casi siempre debe usarse con un grupo marcado o sin marcar.$
coincide con el final de la cadena. Por ejemplo,(?:,|$)
coincide hasta una,
o el final de la cadena.
Analizar vínculos HTML de una página de inicio. La expresión regular es
<a .*?>.*?</a>
. Eso extrae cada enlace de un documento HTML grande en una serie de filas.<a
es una coincidencia literal para el texto “<a”..*?.
es cualquier carácter,*
es 0 o más. El?
modifica a*
para hacerlo coincidir con la coincidencia más corta posible. Sin esto, la expresión podría encontrar un solo token desde el comienzo del primer enlace hasta el final del último.>
Esto es una coincidencia literal para el texto “ > ”..*?
la coincidencia más corta posible de cualquier carácter que cumple con la RegEx completa.</a>
Esto es una coincidencia literal para el texto “ </a> ”. Eso termina la coincidencia.