Ferramenta Tabela de Contingência
Fluxo de trabalho de exemplo
A ferramenta Tabela de Contingência tem um fluxo de trabalho de exemplo. Visite Exemplos de fluxos de trabalho para saber como acessar esse e muitos outros exemplos diretamente do Alteryx Designer.
Use a ferramenta Tabela de Contingência para analisar até quatro variáveis/campos e determinar como eles se relacionam entre si. Tem um uso semelhante ao da ferramenta Tabela de Frequência. A ferramenta produz duas saídas: uma saída de dados que lista todas as combinações de valores entre os campos selecionados, com uma coluna de frequência e uma coluna de porcentagem. A saída do relatório produz tabelas para mostrar as combinações de valores entre os campos e também inclui algumas percentagens adicionais por linha e coluna.
Se você estiver analisando apenas dois campos, também poderá optar por incluir a estatística qui-quadrado no relatório. Ela é usada para investigar se as distribuições de variáveis categóricas diferem uma da outra.
O R deve estar instalado para que essa opção funcione com sucesso. Vá para Opções > Baixar ferramentas preditivas e faça login no Portal de Downloads e Licenças da Alteryx para instalar o R e os pacotes usados pela ferramenta R. Visite Baixar e utilizar ferramentas preditivas.
Configurar a ferramenta
Incluir estatística qui-quadrado: uma estatística qui-quadrado (X2) é usada para investigar se as distribuições de variáveis categóricas diferem umas das outras. Esses dados serão incluídos na saída do relatório. Selecione os dois campos a serem analisados por meio da Variável 1 e Variável 2.
Não incluir estatística qui-quadrado: no mínimo dois e no máximo quatro campos podem ser selecionados. Ao selecionar campos para qualquer opção, estas regras se aplicam:
Cada variável deve ter valores exclusivos. Se os valores não forem exclusivos entre os campos, um erro será exibido.
Certos tipos de campo não podem ser selecionados: FixedDecimal (decimal fixo), Float, Double (duplo), Date (data), Time (hora), DateTime (data/hora), Blob e SpatialObj. Tipos de campo Integer (inteiro) são permitidos, mas devem ser usados apenas se o campo for verdadeiramente categórico.
Visualizar a saída
Âncora D: a saída de dados inclui estes campos:
Nome
Descrição
InputField_SelectedField1 (2, 3, 4)
Nome original do campo nos dados de entrada.
Dependendo de quantos campos forem selecionados, "InputField_SelectedField3" e "InputField_SelectedField4" podem não estar presentes e a parte em itálico é atualizada com o nome do campo selecionado.
Frequência
Contagem de vezes em que o valor está presente nos dados de entrada para o nome do campo fornecido.
Porcentagem
(Frequência/total de registros) *100
Âncora R: a saída do relatório inclui uma tabela de contingência para cada campo selecionado.
O primeiro registro nessa saída mostra avisos para tipos de campo. Se algum dos campos selecionados estiver configurado como tipos de dados numéricos, será exibido um aviso. O restante do relatório mostra uma tabela de contingência para cada combinação de valores de campo, o cabeçalho da tabela exibe os campos selecionados pelo usuário e os valores para quaisquer campos que não estejam na tabela. A tabela também mostra uma coluna Total e linhas para Frequência, Porcentagem, Linha de porcentagem e Coluna de porcentagem.
Se a opção estatística qui-quadrado estiver selecionada, esses valores serão exibidos abaixo da tabela:
"Qui-quadrado": o valor qui-quadrado calculado.
"df": graus de liberdade (degrees of freedom).
valor-p. O valor estatístico retornado pelo R. Quanto menor o valor-p, mais provável é que as variáveis sejam dependentes entre si.
Âncora I: a saída interativa inclui um gráfico onde o visualizador pode personalizar o que é exibido com uma série de opções de menu suspenso.