Streudiagramm-Tool
One-Tool-Beispiel
Für das Streudiagramm-Tool gibt es ein One-Tool-Beispiel. Unter Beispiel-Workflows erfahren Sie, wie Sie dieses und viele weitere Beispiele direkt in Alteryx Designer aufrufen können.
Mit dem Streudiagramm-Tool können Sie verbesserte Streudiagramme mit Optionen zum Einfügen von Kastendiagrammen (Boxgrafiken) an den Rändern, einer linearen Regressionslinie, einer geglätteten Kurve über die nichtparametrische Regression, einer geglätteten bedingten Streuung, Ausreißererkennung und einer Regressionslinie erstellen.
Über die geglättete Kurve können Sie die Art der Beziehung zwischen zwei Variablen im Vergleich zu einem herkömmlichen Streudiagramm direkter erkennen. Dies gilt insbesondere für Fälle mit vielen Beobachtungen oder hochgradig gestreuten Daten.
Dieses Tool verwendet das R-Tool. Gehen Sie zu Optionen > Prognose-Tools herunterladen und melden Sie sich beim Alteryx Downloads and Licenses-Portal an, um R und die vom R-Tool verwendeten Pakete zu installieren. Siehe Prognose-Tools herunterladen und verwenden.
Tool-Konfiguration
Registerkarte „Konfiguration“
Auf der Registerkarte Konfiguration können Sie die obligatorischen Steuerelemente für das Streudiagramm festlegen.
X-Feld (horizontal): das Feld (Spalte), das auf der horizontalen Achse des Diagramms verwendet werden soll. Es können nur numerische Felder ausgewählt werden.
Y-Feld (vertikal): das Feld (Spalte), das auf der vertikalen Achse des Diagramms verwendet werden soll. Es kann entweder ein numerisches Feld oder ein binäres kategoriales Feld verwendet werden. Wenn Sie ein binäres kategoriales Feld auswählen, wird ein neues Feld erstellt (bei dem das Suffix „.num“ an den Originalfeldnamen angehängt wird), das die numerischen Werte 0 oder 1 enthält. Wenn eine kategoriale Variable mit mehr als zwei Werten ausgewählt wird, gibt der Knoten einen Fehler zurück.
Das Feld Y ist eine binäre kategoriale Variable: Kontrollkästchen, mit dem angegeben wird, dass das Y-Feld eine binäre kategoriale Variable ist. Wenn es aktiviert ist, werden Sie aufgefordert, den Feldwert anzugeben, der dem Wert „1“ entspricht (das „Ziel“), wobei Einträge mit anderen Feldwerten den Wert „0“ erhalten.
Registerkarte „Diagramm-Elemente“
Auf der Registerkarte Diagramm-Elemente können Sie die Regeln für das Zeichnen von Daten festlegen.
Linie (Regression) der kleinsten Quadrate:: zeigt eine einfache lineare Regressionslinie zwischen den X- und Y-Feldern an. Standardmäßig enthalten
Linie glätten: zeigt eine nichtlineare Linie zwischen den X- und Y-Feldern an, die mithilfe eines LOESS-Modells (nichtparametrische lokale Regression) erstellt wird. Standardmäßig enthalten
Glättungsspanne: Parameter, der die Größe des lokalen Bereichs festlegt, mit dem die LOESS-Prognosen erstellt werden. Je kleiner die Zahl, desto kleiner ist der verwendete Bereich.
Streuung anzeigen: Zwei Kurven zeigen die Ergebnisse der LOESS-Modelle für sowohl die positiven als auch die negativen Quadratmittel-Residuen der ursprünglichen LOESS-Linie, um die bedingte Streuung und die Asymmetrie in den Fehlern anzuzeigen. Standardmäßig enthalten
Kastendiagramme an den Rändern: fügt eindimensionale Kastendiagramme des X- und Y-Feldes entlang der entsprechenden Zugriffe an. Dies ist nützlich, um die Verteilung der Werte der beiden Felder zu beurteilen. Standardmäßig enthalten.
Jitter X: Wenn diese Option aktiviert ist, werden die X-Werte zufällig in geringem Maß gestört. Dies ist nützlich, wenn eine größere Anzahl von Datensätzen im X-Feld nur einen oder wenige Werte annimmt. Dies beeinflusst nur die Darstellung der Punkte im Diagramm, nicht die angepassten Regressions- und LOESS-Linien.
Jitter Y: Wenn diese Option aktiviert ist, werden die Y-Werte zufällig in geringem Maß gestört. Dies ist nützlich, wenn eine größere Anzahl von Datensätzen im Y-Feld nur einen oder wenige Werte annimmt. Dies beeinflusst nur die Darstellung der Punkte im Diagramm, nicht die angepassten Regressions- und LOESS-Linien.
Log X-Achse: Wenn diese Option aktiviert ist, wird für die X-Werte eine natürliche logarithmische Transformation durchgeführt. Dies ist oft hilfreich, um bestimmte Typen nichtlinearer Beziehungen zu untersuchen.
Log Y-Achse: Wenn diese Option aktiviert ist, wird für die Y-Werte eine natürliche logarithmische Transformation durchgeführt. Dies ist oft hilfreich, um bestimmte Typen nichtlinearer Beziehungen zu untersuchen.
Diagramm nach Gruppen erstellen: Mit dieser Option können Sie die Auswirkung eines kategorialen Feldes auf die Beziehung zwischen den X- und Y-Feldern untersuchen, wobei jeder Wert des kategorialen Feldes eine Gruppe von X- und Y-Werten ergibt. Die Gruppen werden in unterschiedlichen Farben und mit verschiedenen Symbolen gezeichnet. Wenn diese Option aktiviert ist, werden Sie aufgefordert, das kategoriale Feld anzugeben, das für das Erstellen von Gruppen verwendet wird, ob (optional) für alle Gruppen Regressions- und LOESS-Kurven gezeichnet werden sollen sowie die Position der Legende, die die verschiedenen Gruppen beschriftet.
Registerkarte „Stiloptionen“
Verwenden Sie die Registerkarte Stiloptionen, um die Diagrammsteuerelemente wie Beschriftungen und Skalierung festzulegen.
X-Achsenbeschriftung (optional): optionale Beschriftung für die X-Achse (horizontal). Standardmäßig wird der Name des X-Feldes verwendet.
Y-Achsenbeschriftung (optional): optionale Beschriftung für die Y-Achse (vertikal). Standardmäßig wird der Name des Y-Feldes verwendet.
Punktgrößenskala: steuert die Größe der Punkte in der Anzeige, wobei größere Werte zu einer größeren Punktgröße führen.
Größenskala Achsentext: steuert die Größe der Zahlen und Skalenstriche entlang der Achsen, wobei größere Werte zu einer größeren Textgröße führen.
Größenskala Achsenbeschriftung: steuert die Größe der Achsenbeschriftung entlang der Achsen, wobei größere Werte zu einer größeren Textgröße führen.
Größenskala Haupttiteltext: steuert die Größe des Haupttiteltextes, wobei größere Werte zu einer größeren Textgröße führen.
Diagramm-Optionen-Registerkarte
Verwenden Sie die Diagramm-Optionen-Registerkarte, um die Steuerelemente für die grafische Ausgabe festzulegen.
Diagrammgröße: Wählen Sie Inch oder Zentimeter aus und geben Sie die Breite und Höhe für das Diagramm an.
Diagrammauflösung: Wählen Sie die Diagrammauflösung in Punkten pro Inch aus: 1x (96 dpi), 2x (192 dpi) oder 3x (288 dpi).
Eine geringere Auflösung erzeugt eine kleinere Datei und eignet sich am besten für die Anzeige auf einem Bildschirm.
Eine höhere Auflösung erzeugt eine größere Datei mit einer besseren Druckqualität.
Größe der Basisschriftart (Punkte): Wählen Sie die Größe der Schrift im Diagramm aus.
Ausgabe anzeigen
Gibt ein Alteryx-R-Diagrammobjekt aus, das beim Erstellen benutzerdefinierter Berichte verwendet werden kann.