Skip to main content

Green hexagon containing a left parenthesis, period, asterisk and right parenthesis. Herramienta RegEx

Ejemplo de cada herramienta

La herramienta RegEx tiene un ejemplo de uso. Consulta Flujos de trabajo de muestra para aprender cómo acceder a este y muchos otros ejemplos directamente en Alteryx Designer.

Utiliza la herramienta RegEx (Expresión regular) a fin de aprovechar la sintaxis de expresiones regulares para analizar, coincidir o reemplazar datos.

Compatibilidad de RegEx

Aunque las expresiones regulares se admiten en Alteryx Designer, los usuarios son responsables de sus propias expresiones y de cómo estas afectan a sus datos.

Para obtener más recursos sobre cómo escribir expresiones regulares, consulta https://regex101.com/, un sitio no afiliado a Alteryx, o RegEx Coach, una aplicación gráfica no afiliada para Windows que puedes utilizar a fin de experimentar con expresiones regulares (compatibles con Perl) de forma interactiva.

Para obtener más información sobre Boost RegEx, consulta estos recursos:

Configurar la herramienta

  1. Selecciona la Columna para analizar.

  2. En Formato para convertir:

    • Ingresa tu Expresión regular. Utiliza el botón “+” para acceder a expresiones regulares comunes que podrías necesitar al crear la expresión. Encuentra más información en el sitio web Sintaxis de expresiones regulares de Perl.

    • No distingue entre mayúsculas y minúsculas: opción seleccionada de forma predeterminada. Las búsquedas no distinguen entre mayúsculas y minúsculas.

  3. En Salida, selecciona el Método de salida que se utilizará al analizar. Luego, configura las propiedades relacionadas.

    • Reemplazar: reemplaza la expresión que buscaste con una segunda expresión.

      • Texto de reemplazo: ingresa una expresión para reemplazar la expresión regular original identificando el grupo marcado con el que se reemplazará la expresión. Utiliza el botón “+” para acceder a expresiones regulares comunes que podrías necesitar al crear la expresión.

      • Copiar texto no coincidente a la salida

    • Tokenizar: divide los datos entrantes mediante una expresión regular. Esta opción funciona de forma similar a la herramienta Texto a columnas, excepto que en lugar de hacer coincidir y quitar lo que no deseas, haces coincidir lo que deseas conservar. Si quieres que la coincidencia se aplique a todo el token, y si tienes un grupo marcado, solo se mostrará esa parte. Ve a Ejemplos del método Tokenizar a continuación.

      • Dividir en columnas: divide una sola columna de datos en cada instancia del delimitador especificado en varias columnas.

        • Cantidad de columnas: define cuántas columnas se crean.

        • Columnas extra: selecciona el comportamiento que se aplica a las columnas adicionales.

          • Descartar extras con advertencia: los datos que se extienden más allá de la división se descartan y se genera una advertencia que indica que hubo exceso de información.

          • Descartar extras sin advertencia: los datos que se extienden más allá de la división se descartan y no se genera ninguna advertencia.

          • Error: los datos que se extienden más allá de la división causan un error y deja de procesarse el flujo de trabajo.

        • Nombre de raíz de salida: introduce el nombre de las columnas recién generadas en las que deben basarse. Las nuevas columnas se denominan con el nombre de la raíz y un número entero anexado que aumenta en serie.

      • Dividir en filas: divide una sola columna de datos en cada instancia del delimitador especificado en varias filas. Utiliza una columna clave en tu registro para que no pierdas noción de qué valor proviene de qué fila.

    • Analizar: separa la expresión en nuevas columnas y define el Nombre, Tipo y Tamaño de las nuevas columnas. Se crea una nueva columna en la tabla Columnas de salida con estas columnas:

      • Nombre: selecciona el nombre de la columna para ingresar un nuevo nombre.

      • Tipo: utiliza el menú desplegable para seleccionar el nuevo tipo de datos.

      • Tamaño: selecciona el tamaño de los datos para ingresar un nuevo tamaño.

      • Expresión: se rellena automáticamente.

    • Coincidencia: anexa una columna que contiene un número: 1 si la expresión coincidió, 0 si no lo hizo.

      • Nombre de columna con estado de coincidencia: proporciona un nombre para la columna anexada.

      • Error si no coincide: selecciona esta opción para generar un error si la expresión y la cadena no coinciden para finalizar el procesamiento del flujo de trabajo.

Ejemplos del método Tokenizar

Estos casos prácticos se basan en el método Tokenizar de la herramienta RegEx.

  • Dividir una cadena de 9 caracteres 123456789 en 3 campos. La expresión regular es ....

  • Dividir una cadena de 9 caracteres en 3 campos, y se muestra solo el segundo carácter. La expresión regular es .(.)..

  • Analizar un campo con el delimitador Ctrl-A. La expresión regular para tokenizar una cadena delimitada por Ctrl-A es [^\cA]+.

    • [^...] Los corchetes especifican una coincidencia con un solo carácter en un conjunto de caracteres. Al iniciar el conjunto con ^, se cambia para que coincida con cualquier carácter que no esté en el conjunto.

    • \cA Esto simplemente coincide con el carácter de Ctrl-A.

    • + Esto significa coincidir con 1 o más del anterior.

  • Permitir que tokens en blanco conserven entradas: abc, ,def. La expresión regular es ([^,]*) (?:,|$).

    • (...) El paréntesis crea un grupo marcado de la expresión. El modo Tokenizar te permite hacer coincidir una parte más grande del campo de entrada, pero solo devuelve un subconjunto marcado. De esta manera evitarás que se devuelva el delimitador. Solo puedes tener 1 expresión marcada.

    • [^,] Al iniciar el conjunto con ^, se cambia para que coincida con cualquier carácter que no esté en el conjunto, en este caso una ,.

    • * Coincide con 0 o más del anterior, lo que crea un conjunto vacío. No puedes terminar aquí porque el motor de RegEx no admite una coincidencia de 0 caracteres, ya que hay un número infinito de coincidencias, así que tenemos que terminar la coincidencia en algo.

    • (?:....) Este es un grupo sin marcar. Necesitamos esto para el o para el que usamos una |.

    • | Esto indica coincidir con lo anterior o lo posterior, pero no con ambos. Esto casi siempre debe usarse con un grupo marcado o sin marcar.

    • $ Coincide con el final de la cadena. Por lo tanto, (?:,|$) coincide hasta una , o el final de la cadena.

  • Analizar vínculos HTML de una página de inicio. La expresión regular es <a .*?>.*?</a>. Esto extrae cada enlace de un documento HTML grande en una serie de registros.

    • <a Esto es una coincidencia literal para el texto <a.

    • .*?. es cualquier carácter, * es 0 o más. El ? modifica a * para hacerlo coincidir con la coincidencia más corta posible. Sin esto, la expresión podría encontrar un solo token de el comienzo del primer enlace hasta el final del último.

    • > Esto es una coincidencia literal para el texto >.

    • .*? la coincidencia más corta posible de cualquier carácter que cumple con la RegEx completa.

    • </a> Esto es una coincidencia literal para el texto </a>. Esto termina la coincidencia.