Herramienta Muestreo de simulación
La herramienta Muestreo de simulación muestrea datos paramétricamente desde una distribución, desde datos de entrada, o como una combinación que mejor se adapte a una distribución. Los datos también pueden “dibujarse” si no estás seguro de los parámetros de una distribución y careces de datos.
Esta herramienta utiliza la herramienta R. Ve a Opciones > Descargar herramientas predictivas e inicia sesión en el portal Descargas y licencias de Alteryx para instalar R y los paquetes utilizados por la herramienta R. Para obtener más información, ve a Descargar y usar herramientas predictivas.
Conectar entradas
Ancla D (opcional): datos de muestra. Esta entrada es necesaria si estás tomando muestras a partir de datos sin procesar o agrupados.
Ancla S (opcional): datos de simulación. Si se han utilizado herramientas de simulación anteriores, los datos de ellas se pueden conectar a esta entrada para anexar los datos y obtener un recuento de iteraciones y semillas.
Configurar la herramienta
Selecciona mecanismo de muestreo: Muestreo Monte Carlo/simple o Muestreo latino hipercúbico/estratificado. Para el muestreo estratificado a partir de datos, el tamaño máximo de los estratos se determina por la elección del tamaño del fragmento.
Tamaño de los fragmentos: el tamaño máximo de los datos a evaluar a la vez. Esto se puede utilizar para evitar la limitación de procesamiento en memoria de R. Para el muestreo estratificado a partir de datos, este es también el tamaño máximo de los estratos.
Semilla: la semilla aleatoria utilizada para el muestreo. Esta opción no está disponible si un conjunto de datos que contiene un campo de semilla está conectado a la entrada S, ya que esa semilla se incrementa y se utiliza en su lugar.
Cantidad de iteraciones: el número de muestras a seleccionar. Esta opción no está disponible si un conjunto de datos está conectado a la entrada S, ya que el tamaño de ese conjunto de datos determina el número de iteraciones.
Seleccionar el modo de muestreo:
Muestrear paramétricamente
Para el muestreo paramétrico, no conectes un flujo de datos a la entrada D.
Introducir un nombre para los datos salientes: especifica un nombre de campo para el campo de salida.
Seleccionar distribución: selecciona de la lista de distribuciones admitidas. Junto con los parámetros, esto determina el gráfico de la función de densidad/masa acumulada representada.
Introducir parámetros y límites: para definir los parámetros de la distribución, utiliza los controles deslizantes o las flechas arriba/abajo para ajustar los valores o introduce los valores manualmente. Junto con la distribución seleccionada, esto determina el gráfico de la función de densidad/masa acumulada representada. Opcionalmente, puedes especificar límites para la distribución. Si se especifican los límites, se utiliza el rechazo de la muestra para asegurar que las muestras extraídas estén entre el límite inferior y el límite superior. Los límites son inclusivos.
Muestra desde los datos
Conecta un flujo de datos a la entrada D o a la muestra a través de la entrada manual.
Muestra con reemplazo: selecciona esta opción para muestrear con reemplazo.
Especificar la clase de datos: selecciona una de las opciones de datos.
Datos sin procesar (no agrupados): selecciona los campos para la muestra y, luego, una estrategia de muestreo (ver abajo).
Datos agrupados: requiere un campo ID y un campo de valor con contenedores espaciados equitativamente. Los IDs son números espaciados equitativamente. Especifica un nombre para los datos salientes (nombre del campo de salida), la estrategia de muestreo (ver más abajo), el campo ID para los datos agrupados y el campo valor para los datos agrupados.
Entrada manual: introduce datos manualmente a través de un widget de ruleta. Introduce un nombre para los datos salientes (nombre del campo de salida) y los parámetros del widget de ruleta. Utiliza las opciones Inferior, Superior, Altura y Núm. de contenedores para configurar el tamaño de la cuadrícula. Haz clic en la cuadrícula para proporcionar la altura de los contenedores.
Seleccionar campos para muestrear: selecciona columnas para muestrear datos.
Seleccionar estrategia de muestreo: elige cómo muestrear tus datos. Muestrea filas enteras, cada columna de forma independiente, o con la distribución más adecuada. Si eliges muestrear con la distribución más adecuada, selecciona las distribuciones a las que ajustar los datos.
Ver la salida
Conecta una herramienta Examinar con el ancla de salida para ver los resultados.
Ancla D: la salida de los datos. Este es el resultado de la simulación.