Ferramenta Amostragem de Simulação
A ferramenta Amostragem de Simulação faz a amostragem paramétrica de uma distribuição, dos dados de entrada ou como uma combinação que seja mais adequada à distribuição. Os dados também podem ser "extraídos" se você não tem certeza dos parâmetros de uma distribuição e se há falta de dados.
Essa ferramenta utiliza a ferramenta R. Vá para Opções > Baixar ferramentas preditivas e faça login no Portal de Downloads e Licenças da Alteryx para instalar o R e os pacotes usados pela ferramenta R. Acesse Baixar e utilizar ferramentas Preditivas para obter mais informações.
Conectar entradas
Âncora D (opcional): dados de amostra. Esta entrada é obrigatória se você faz a amostragem a partir de dados brutos ou a partir de dados compartimentalizados.
Âncora S (opcional): dados de simulação. Se já foram usadas ferramentas de simulação, os dados delas podem ser conectados a esta entrada para acrescentá-los e obter uma contagem e uma dispersão das iterações.
Configurar a ferramenta
Selecionar mecanismo de amostragem: Monte Carlo/amostragem simples ou hipercubo latino/amostragem estratificada. Na amostragem estratificada de dados, o tamanho máximo dos estratos é determinado pela opção de tamanho das partes.
Tamanho das partes: o tamanho máximo dos dados para avaliar de cada vez. Isso pode ser usado para evitar a limitação de processamento na memória do R. Na amostragem estratificada de dados, esse valor é também o tamanho máximo dos estratos.
Semente: a semente aleatória usada na amostragem. Essa opção não está disponível se um conjunto de dados que contém um campo de semente está conectado à entrada S, já que a semente é incrementada e usada no lugar.
Número de iterações: o número de amostras que serão selecionadas. Essa opção não está disponível se um conjunto de dados está conectado à entrada S, já que o tamanho do conjunto de dados determina o número de iterações.
Selecionar modo de amostragem:
Amostrar parametricamente
Na amostragem paramétrica, não conecte um fluxo de dados à entrada D.
Inserir um nome para os dados de saída: especifique um nome para o campo de saída.
Selecionar distribuição: selecione na lista de distribuições compatíveis. Junto dos parâmetros, essa opção determina o gráfico da função de densidade/massa cumulativa representada.
Inserir parâmetros e limites: para definir os parâmetros da distribuição, use os controles deslizantes ou as setas para cima/para baixo para ajustar os valores ou inseri-los manualmente. Junto da distribuição selecionada, essa opção determina o gráfico da função de densidade/massa cumulativa representada. Você pode especificar limites para a distribuição. Se os limites forem especificados, a amostragem de rejeição será usada para garantir que as amostras extraídas estejam entre o "Limite inferior" e "Limite superior". Os limites são inclusivos.
Amostra dos dados
Conecte um fluxo de dados à entrada D ou à amostra por meio de entrada manual.
Amostragem com substituição: selecione essa opção para fazer a amostragem com substituição.
Especificar o tipo dos dados: selecione uma das opções de dados.
Dados brutos (não compartimentalizados): selecione os campos e uma estratégia de amostragem (ver abaixo).
Dados compartimentalizados: requer um campo de ID e um campo de valor com compartimentos (bins) igualmente espaçados. Os IDs são números igualmente espaçados. "Insira um nome para os dados de saída" (nome do campo de saída), a estratégia de amostragem (ver abaixo) e os campos de ID e de valor para os dados compartimentalizados.
Entrada manual: insira os dados manualmente usando um widget de amostragem. Insira um nome para os dados de saída (nome do campo de saída) e os parâmetros do widget de amostragem. Use as opções de Lower (mínimo), Upper(máximo), Height (altura), and Num Bins (tamanho do compartiment) para configurar o tamanho da grade. Clique na grade para informar a altura dos compartimentos.
Selecionar campos para amostra: selecione as colunas das quais fazer a amostragem de dados.
Selecionar estratégia de amostragem: escolha como fazer a amostragem de dados. "Amostrar linhas inteiras", "Amostrar cada coluna de forma independente" ou "Amostrar a partir da distribuição de melhor ajuste". Se você fizer a amostragem a partir da distribuição de melhor ajuste, selecione as distribuições às quais os dados serão ajustados.
Visualizar a saída
Conecte uma ferramenta Navegar a cada âncora de saída para exibir os resultados.
Âncora D: a saída de dados. Este é o resultado da simulação.