Skip to main content

Distribution Analysis Tool Icon Distributionsanalyse-Tool

One-Tool-Beispiel

Die Distributionsanalyse hat ein One-Tool-Beispiel. Unter Beispiel-Workflows erfahren Sie, wie Sie dieses und viele weitere Beispiele direkt in Alteryx Designer aufrufen können.

Verwenden Sie die Distributionsanalyse, um eine oder mehrere Verteilungen an die Eingabedaten anzupassen und sie auf der Grundlage einer Reihe von Anpassungsgüte*-Statistiken zu vergleichen. Basierend auf der statistischen Relevanz (p-Werte) der Ergebnisse dieser Tests können Sie festlegen, welche Distribution die Daten am besten darstellt.

Das Tool „Distributionsanalyse“ ist hilfreich, um sich einen allgemeinen Überblick über die Daten zu verschaffen und Entscheidungen zu treffen, wie die Daten analysiert werden sollen. Zum Beispiel eignen sich normalverteilte Daten in der Regel für eine lineare Regressionsanalyse; gammaverteilte Daten sind hingegen besser für eine Analyse mit dem Gamma-Regressionstool geeignet.

Dieses Tool verwendet das R-Tool. Gehen Sie zu Optionen > Prognose-Tools herunterladen und melden Sie sich beim Alteryx Downloads and Licenses-Portal an, um R und die vom R-Tool verwendeten Pakete zu installieren. Gehen Sie zu Prognose-Tools herunterladen und verwenden.

Tool-Konfiguration

Registerkarte „Konfiguration“

Auf der Registerkarte Konfiguration können Sie die obligatorischen Steuerelemente für die Distributionsanalyse festlegen.

  1. Wählen Sie ein Feld für die Analyse aus: Wählen Sie ein Feld aus den eingehenden Daten für die Analyse aus.

  2. Wählen Sie Distributionen für den Vergleich aus: Wählen Sie eine oder mehrere Distributionen für den Vergleich aus. Die Distributionsoptionen sind:

    • Normal: Eine häufig vorkommende kontinuierliche Wahrscheinlichkeitsverteilung, die sowohl in den Natur- als auch in den Sozialwissenschaften häufig zur Darstellung von reellwertigen Zufallsvariablen verwendet wird (mit anderen Worten: kontinuierliche Zufallsvariablen, die sowohl positive als auch negative Werte annehmen können).

    • Lognormal: Eine kontinuierliche Wahrscheinlichkeitsverteilung einer Zufallsvariablen, deren Logarithmus normalverteilt ist. Diese Verteilung eignet sich für die Beschreibung natürlicher Phänomene wie z. B. Wachstumsraten und Größenverteilungen. Darüber hinaus wird die Lognormalverteilung häufig herangezogen, um die Einkommensverteilung in einer ausreichend großen Bevölkerungsgruppe zu beschreiben.

    • Weibull: Eine relativ flexible Verteilung, die einer Exponentialverteilung ähnelt. Diese Verteilung tritt häufig in Daten auf, die Fehlerraten in irgendeiner Form beschreiben (z. B. zufälliges Mechanikversagen, Mortalität, Kündigungsraten, mechanische Verschleißraten usw.).

    • Gamma: Eine kontinuierliche Wahrscheinlichkeitsverteilung, die sich durch eine signifikante Konzentration an Fällen über nicht ganzzahlige, nicht negative Werte auszeichnet. Gleichzeitig ist die Darstellung der Wahrscheinlichkeit für weitaus höhere Werte möglich. Die Gammaverteilung kommt in vielen Bereichen zum Einsatz. Sie tritt häufig in Daten auf, die Gesamt- bzw. Durchschnittsbeträge pro Fall beschreiben (z. B. die Durchschnittsgröße eines Versicherungsanspruchs), die pro Person gemessen wurden.

Die Lognormal-, Weibull- und Gamma-Verteilungen können nur für nicht negative Daten verwendet werden.

Spalten, die eindeutige Kennungen enthalten wie Ersatzprimärschlüssel und natürliche Primärschlüssel, sollten in Statistikanalysen nicht verwendet werden. Sie enthalten keinen Prognosewert und können Laufzeitausnahmen verursachen.

Diagramm-Optionen-Registerkarte

Verwenden Sie die Diagramm-Optionen-Registerkarte, um die Steuerelemente für die grafische Ausgabe festzulegen.

  • Diagramm-Größe: Wählen Sie Zoll oder Zentimeter für die Größe des Diagramms und legen Sie die Werte für Breite und Höhe fest.

  • Diagrammauflösung: Wählen Sie die Diagrammauflösung in Punkten pro Inch aus: 1x (96 dpi), 2x (192 dpi) oder 3x (288 dpi).

    • Eine geringere Auflösung erzeugt eine kleinere Datei und eignet sich am besten für die Anzeige auf einem Bildschirm.

    • Eine höhere Auflösung erzeugt eine größere Datei mit einer besseren Druckqualität.

Ausgabe anzeigen

Ein Satz an Berichtsausschnitten bestehend aus einem Histogramm, zusammenfassenden Basisstatistiken der Testergebnisse, Anpassungsgüte-Statistiken, Datenquantilen pro Verteilung und Verteilungsparametern.

* D'Agostino, R., Stephens, M.A. (1986) Goodness of Fit Techniques.