Strumento Tabella di contingenza
Ruolo utente
Ruolo utente* | Accesso allo strumento |
---|---|
Utente completo | ✓ |
Utente base | X |
*Si applica ai clienti che utilizzano le edizioni Professional ed Enterprise di Alteryx One con Designer versione 2025.1 o successiva.
Utilizza Tabella di contingenza per esaminare fino a quattro variabili/campi e stabilire le relazioni tra gli stessi. Lo strumento Tabella di contingenza ha un uso simile a quello dello strumento Tabella di frequenza. Lo strumento produce due output: un output di dati che elenca tutte le combinazioni di valori tra i campi selezionati, con una colonna frequenza e una colonna percentuale. L'output del report produce tabelle per mostrare le combinazioni di valori tra i campi e include anche alcune percentuali aggiuntive di righe e colonne.
Se stai analizzando solo due campi, puoi anche scegliere di generare la statistica chi-quadro da includere nel report. Viene utilizzata una statistica chi-quadro per controllare se le distribuzioni di variabili categoriche differiscono tra loro.
Esempio di uno strumento
La Tabella di contingenza presenta l'opzione Esempio di uno strumento. Vai a Esempi di flusso di lavoro per scoprire come accedere a questo e a molti altri esempi direttamente in Alteryx Designer.
Installation
R must be installed for this option to run successfully. Go to Options > Download Predictive Tools and sign in to the Alteryx Downloads and Licenses portal to install R and the packages used by the R tool. Visit Download and Use Predictive Tools.
Configurazione dello strumento
Includi statistiche chi-quadro: viene utilizzata una statistica chi-quadro (X2) per controllare se le distribuzioni di variabili categoriche differiscono tra loro. Questi dati saranno inclusi nell'output del report. Seleziona i due campi da analizzare tramite Variabile 1 e Variabile 2.
Non includere statistica chi-quadro: è possibile selezionare almeno due campi e fino a quattro campi. Quando selezioni i campi per una delle due opzioni, si applicano le seguenti regole:
Ogni variabile deve avere valori univoci. Se i valori non sono univoci nei campi, viene generato un errore.
Non è possibile selezionare determinati tipi di campo: FixedDecimal, Float, Double, Date, Time, DateTime, Blob e SpatialObj. I tipi di campo interi sono consentiti ma devono essere utilizzati solo se il campo è realmente categorico.
Visualizzazione dell'output
Ancoraggio D: l'output dei dati include i seguenti campi:
Nome
Descrizione
InputField_SelectedField1 (2, 3, 4)
Nome del campo originale dei dati di input.
A seconda del numero di campi selezionato, InputField_SelectedField3 e InputField_SelectedField4 potrebbero non essere presenti e la parte in corsivo viene aggiornata con il nome del campo attualmente selezionato.
Frequenza
Numero di volte in cui il valore è presente nei dati di input per il nome campo specificato.
Percentuale
(Frequenza/record totali)*100
Ancoraggio R: l'output del report include una tabella di contingenza per ciascun campo selezionato.
Il primo record di questo output mostra eventuali avvertenze per i tipi di campo. Se uno dei campi selezionati è impostato su tipi di dati numerici, viene visualizzato un avviso. Il resto del report mostra una tabella di contingenza per ogni combinazione di valori di campo, l'intestazione della tabella mostra i campi selezionati dall'utente e i valori per tutti i campi non visualizzati nella tabella. La tabella mostra anche una colonna Totale e le righe per Frequenza, Percentuale, Percentuale riga e Percentuale colonna.
Se l'opzione statistica chi-quadro è selezionata, sotto la tabella vengono visualizzati i seguenti valori:
Chi-quadro: il valore chi-quadro calcolato.
df: gradi di libertà.
Valore-p: il valore statistico restituito da R. Più basso è il valore p, più è probabile che le variabili siano dipendenti l'una dall'altra.
Ancoraggio I: l'output interattivo include un grafico in cui il visualizzatore può personalizzare i contenuti visualizzati con una serie di opzioni a discesa.