Strumento Analisi di distribuzione
Esempio di uno strumento
Analisi di distribuzione presenta l'opzione Esempio di uno strumento. Consulta Esempi di flussi di lavoro per scoprire come accedere a questo e a molti altri esempi direttamente in Alteryx Designer.
Utilizza Analisi di distribuzione per adattare una o più distribuzioni ai dati di input e confrontarle in base alla bontà di adattamento al modello statistico. In base alla significatività statistica (valori di p) dei risultati di questi test, puoi stabilire quale distribuzione rappresenta al meglio i dati.
Lo strumento Analisi di distribuzione aiuta a comprendere la natura complessiva dei dati e a decidere come analizzarli. Ad esempio, è probabile che i dati che si adattano a una distribuzione normale siano idonei per una Regressione lineare, mentre i dati distribuiti con gamma potrebbero essere più adatti per l'analisi tramite lo strumento Regressione gamma.
Questo strumento utilizza lo strumento R. Vai a Opzioni > Scarica strumenti predittivi e accedi al portale Download e licenze Alteryx per installare R e i pacchetti utilizzati dallo Strumento R. Consulta la sezione Download e utilizzo degli strumenti predittivi.
Configura lo strumento
Scheda Configurazione
Utilizza la scheda Configurazione per impostare i controlli obbligatori per l’analisi di distribuzione.
Seleziona un campo per l'analisi: seleziona un campo dai dati in entrata per l'analisi.
Seleziona distribuzioni per il confronto: seleziona una o più distribuzioni da confrontare. Le opzioni di distribuzione sono:
Normale: una distribuzione di probabilità continua che si verifica frequentemente, usata sia nelle scienze naturali che nelle scienze sociali per rappresentare variabili casuali con valori reali (in altre parole, variabili casuali continue che possono avere sia valori positivi che negativi).
Lognormal: una distribuzione di probabilità continua di una variabile casuale il cui logaritmo è normalmente distribuito. Questa distribuzione è adatta alla descrizione di fenomeni naturali come il tasso di crescita e le distribuzioni dimensionali. Inoltre, viene spesso utilizzata per descrivere la distribuzione del reddito in una popolazione sufficientemente ampia.
Weibull: una distribuzione relativamente flessibile che è strettamente correlata alla distribuzione esponenziale. Si trova spesso in dati che descrivono tassi di "cedimento" di qualche tipo, ad esempio guasti meccanici casuali, mortalità, abbandono, tassi di usura meccanica, ecc.
Gamma: una distribuzione di probabilità continua caratterizzata da una significativa concentrazione di casi a valori inferiori non interi, non negativi, pur consentendo la ragionevole possibilità di valori molto più elevati. La distribuzione Gamma presenta una vasta gamma di usi e si trova comunemente in dati che descrivono importi aggregati (o medi) per caso, ad esempio la dimensione media di un credito assicurativo, misurata per individuo.
Le distribuzioni Lognormal, Weibull e Gamma funzionano solo per i dati non negativi.
Le colonne contenenti identificatori univoci, come le chiavi primarie surrogate e le chiavi primarie naturali, non devono essere utilizzate nelle analisi statistiche. Non hanno alcun valore predittivo e possono causare eccezioni di runtime.
Scheda Opzioni grafiche
Utilizza la scheda Opzioni grafiche per impostare i controlli per l'output grafico.
Dimensione grafico: seleziona Pollici o Centimetri per la dimensione del grafico e imposta i valori Larghezza e Altezza.
Risoluzione grafico: seleziona la risoluzione del grafico in punti per pollice: 1x (96 dpi), 2x (192 dpi) o 3x (288 dpi).
La risoluzione inferiore crea un file più piccolo ed è ideale per la visualizzazione su un monitor.
Una risoluzione più alta crea un file più grande con una migliore qualità di stampa.
Visualizzazione dell'output
Un insieme di estratti di report che includono un istogramma, statistiche di riepilogo di base dei risultati dei test, statistiche di idoneità, quantili di dati per distribuzione e parametri di distribuzione.
*D'Agostino, R., Stephens, M.A. (1986) Goodness of Fit Techniques.