Herramienta Regresión Gamma
Ejemplo de cada herramienta
La herramienta Regresión Gamma tiene un ejemplo de uso. Consulta Flujos de trabajo de muestra para aprender cómo acceder a este y muchos otros ejemplos directamente en Alteryx Designer.
La herramienta Regresión Gamma relaciona una variable estrictamente positiva con distribución gamma de interés (variable objetivo) a una o más variables (variables predictoras) que se espere tengan alguna influencia sobre la variable objetivo.
En varias aplicaciones, los valores de la variable objetivo son siempre estrictamente positivos (es decir, nunca son cero o negativos), pero tienden a agruparse hacia el rango inferior de los valores observados, pero en una pequeña minoría de casos toman valores grandes. Las variables objetivo de esta naturaleza representan un proceso de generación de datos que no es congruente con los supuestos de normalidad subyacentes al modelo tradicional de regresión lineal. Sin embargo, los valores son siempre positivos y no siempre serán números enteros, por lo que no siguen una distribución de Poisson o un proceso basado en la distribución de binomio negativo. Son congruentes con un proceso basado en una distribución Gamma y pueden ser estimados utilizando métodos similares a la regresión lineal, a través del marco del modelo lineal generalizado.
Con esta herramienta, si los datos de entrada vienen de un flujo de datos de Alteryx normal, se utiliza la función glm de R de código abierto para la estimación del modelo. Si la entrada viene de una herramienta Entrada XDF o de una herramienta Salida XDF, se utiliza la función rxGlm de Revo ScaleR para la estimación del modelo. La ventaja de utilizar la función basada en Revo ScaleR es que permite analizar conjuntos de datos mucho más grandes (sin memoria), pero a costa de una sobrecarga adicional para crear un archivo XDF y con la incapacidad de crear parte de la salida de diagnóstico del modelo que está disponible con las funciones de código abierto R.
Esta herramienta utiliza la herramienta R. Dirígete a Opciones > Descargar herramientas predictivas e inicia sesión en el portal Descargas y licencias de Alteryx para instalar R y los paquetes utilizados por la herramienta R. Visita Descargar y usar herramientas predictivas.
Conectar una entrada
Un flujo de datos de Alteryx o un flujo de metadatos XDF que incluye un campo objetivo de interés junto con uno o más campos predictores posibles.
Configurar la herramienta
Utiliza la pestaña Configuración para establecer los controles para tu Regresión Gamma.
Nombre del modelo: cada modelo debe tener un nombre para su posterior identificación. Los nombres del modelo deben comenzar con una letra y pueden contener letras, números y los caracteres especiales de punto (“.”) y guion bajo (“_”). No se permite el uso de otros caracteres especiales. Además, R distingue entre mayúsculas y minúsculas.
Selecciona la variable objetivo: selecciona el campo del flujo de datos que deseas predecir.
Selecciona los campos predictores: selecciona los campos del flujo de datos que crees que “causan” los cambios en el valor de la variable objetivo. Las columnas que contienen identificadores únicos, como claves primarias sustitutas y claves primarias naturales, no deben utilizarse en análisis estadísticos. No tienen ningún valor predictivo y pueden causar excepciones en tiempo de ejecución.
Tipo de modelo: un cuadro desplegable con las opciones de registro, inverso e identidad. Esta opción determina la función de enlace que se utilizará con la familia Gamma para estimar el modelo lineal generalizado.
¿Utilizar ponderaciones de muestreo en la estimación del modelo?(Opcional)…: haz clic en la casilla de verificación y luego selecciona un campo de ponderación del flujo de datos para estimar un modelo que utilice ponderación de muestreo.
Utiliza la pestaña Opciones de gráficos para establecer los controles para la salida gráfica.
Resolución del gráfico: selecciona la resolución del gráfico en puntos por pulgada: 1x (96 ppp); 2x (192 ppp); o 3x (288 ppp).
La resolución más baja crea un archivo más pequeño y es mejor para ver en un monitor.
Una resolución más alta crea un archivo más grande con una mejor calidad para imprimir.
Ver la salida
Ancla O: consta de una tabla del modelo serializado con el nombre del modelo.
Ancla R: consta de los fragmentos de informes generados por la herramienta Regresión gamma: un resumen estadístico, un análisis de desviación de tipo II (ANOD) y gráficos de diagnóstico básicos. La tabla Análisis de desviación de tipo II y los gráficos de diagnóstico básicos no se producen cuando la entrada del modelo proviene de una herramienta Salida XDF o Entrada XDF.