Tool „ARIMA“
One-Tool-Beispiel
Es gibt ein One-Tool-Beispiel für ARIMA. Unter Beispiel-Workflows erfahren Sie, wie Sie dieses und viele weitere Beispiele direkt in Alteryx Designer aufrufen können.
Das Tool „ARIMA“ schätzt ein Zeitreihenprognosemodell unter Verwendung einer Methode für einen autoregressiv integrierten gleitenden Mittelwert (autoregressive integrated moving average, ARIMA) entweder als eindimensionales Modell oder als Modell mit Kovariaten (Prädiktoren). ARIMA ist die am häufigsten eingesetzte Prognosemethode und gilt als die allgemeinste Klasse von Modellen für die Prognose eines Zeitreihenfelds. Die in diesem Tool implementierten ARIMA-Methoden können einen automatischen Ansatz verwenden, um ein Modell basierend auf statistischen Kriterien zu entwickeln. Sie können auch direkt die zugrunde liegenden Parameter eines ARIMA-Modells angeben. Eine detaillierte Erläuterung des ARIMA-Modells sowie eine Beschreibung der automatisierten Methoden, die in diesem Tool verwendet werden, finden Sie in Kapitel 8 des Online-Buchs von Hyndman und Athanasopoulos mit dem Titel Forecasting: Principals and Practice.
Anmerkung
Dieses Tool verwendet das R-Tool. Gehen Sie zu Optionen > Prognose-Tools herunterladen und melden Sie sich beim Alteryx Downloads and Licenses-Portal an, um R und die vom R-Tool verwendeten Pakete zu installieren. Gehen Sie zu Prognose-Tools herunterladen und verwenden.
Eingabe verbinden
Verbinden Sie einen Alteryx-Datenstrom, der historische Daten zu den zu prognostizierenden Zeitreihen enthält, und (optional) einen Satz Kovariaten. Felder, die nicht bei der Modellerstellung verwendet werden, können auch im Datenstrom enthalten sein.
Tool-Konfiguration
Verwenden Sie die Registerkarte Erforderliche Parameter, um die grundlegenden Steuerelemente festzulegen, die für die Erstellung eines ARIMA-Modells erforderlich sind.
Modellname: Jedes Modell muss über einen Namen verfügen, um das Modell später identifizieren zu können. Modellnamen müssen mit einem Buchstaben beginnen und können Buchstaben, Zahlen und die Sonderzeichen Punkt („.“) und Unterstrich („_“) enthalten. Andere Sonderzeichen sind nicht erlaubt und bei „R“ wird zwischen Groß- und Kleinschreibung unterschieden.
Zielfeld auswählen: Wählen Sie das Feld im Datenstrom aus, für das Sie eine Prognose abgeben möchten. Die Messungen für dieses Feld müssen regelmäßig durchgeführt werden (z. B. täglich, monatlich, vierteljährlich usw.). Spalten, die eindeutige Bezeichner enthalten, wie z. B. Ersatzprimärschlüssel und natürliche Primärschlüssel, sollten nicht in statistischen Analysen verwendet werden. Sie enthalten keinen Prognosewert und können Laufzeitausnahmen verursachen.
Kovariate bei der Modelleinschätzung anwenden?: Wenn Sie diese Option aktivieren, wird eine Liste von Kontrollkästchen angezeigt, mit der Sie die Felder auswählen können, die als Kovariaten im ARIMA-Modell verwendet werden sollen.
Zielfeldhäufigkeit: Wählen Sie das Intervall für die Beobachtungen des Zielfelds aus.
Auf der Registerkarte Modellanpassung (optional) können Sie Steuerungselemente für die Datenverarbeitung des Modells anpassen.
Für die automatische Modellerstellung verwendete Parameter anpassen: Wählen Sie diese Option aus, um einen Satz von Parametern anzuzeigen, die eine automatische Modellerstellung beeinflussen. Die Optionen bieten folgende Möglichkeiten:
Anpassen der nichtsaisonalen Komponenten einschließlich der Stufe der ersten Differenzierung, der maximalen Ordnung der autoregressiven Komponente sowie der maximalen Ordnung der Komponente des gleitenden Mittelwerts.
Anpassen der saisonalen Komponenten einschließlich der Stufe der saisonalen Differenzierung, der maximalen Ordnung der saisonalen autoregressiven Komponente sowie der maximalen Ordnung der Komponente des saisonalen gleitenden Mittelwerts
Wählen Sie das Informationskriterium aus, das für die Auswahl zwischen verschiedenen Kandidatenmodellen verwendet wird. Standardmäßig wird das korrigierte „Aikakes Informationskriterium (AICc)“ verwendet. Jedoch kann stattdessen auch das unkorrigierte „Aikakes Informationskriterium (AIC)“ oder das „Bayessches Informationskriterium (BIC)“ ausgewählt werden.
Sie können auch festlegen, ob alle möglichen Modelle evaluiert und miteinander verglichen werden (vollständige Aufzählung), anstatt den standardmäßigen schrittweisen Algorithmus zu verwenden. Es hat sich gezeigt, dass der schrittweise Algorithmus gute Leistungseigenschaften hat und viel weniger rechenintensiv ist. Doch es lässt sich nicht garantiert das beste Einzelmodell finden. Durch Schätzung aller möglichen ARIMA-Modelle lässt sich das beste einzelne Modell zwar finden, doch mit erheblich längerer Laufzeit. Wenn die vollständige Aufzählung ausgewählt wurde, können Sie einige Grenzen für den durchsuchten Bereich platzieren und die maximal zulässige Ordnung des Modells festlegen. Außerdem haben Sie auch die Möglichkeit, mehrere Kerne des Rechners zu verwenden, in denen Alteryx ausgeführt wird.
Es können auch Optionen festgelegt werden, die eine „Abweichung“ im Modell zulassen und die bestimmen, ob eine Box-Cox-Transformation (einschließlich der Festlegung des Lambdawerts) auf das Zielfeld angewendet wird.
Vollständig benutzerdefiniertes Modell: Wählen Sie diese Option, um manuell ein ARIMA-Modell anzugeben. Die erforderlichen Parameter umfassen:
Die nicht saisonalen Komponenten der Ordnung der autoregressiven Komponente (p), der Grad der ersten Differenzierung (d) und die Ordnung des gleitenden Mittelwerts (q).
Die saisonalen Komponenten der Ordnung der saisonalen autoregressiven Komponente (p), der Grad der saisonalen Differenzierung (D) und die Ordnung des saisonalen gleitenden Mittelwerts (Q).
Es können auch Optionen festgelegt werden, die eine „Abweichung“ im Modell zulassen und die bestimmen, ob eine Box-Cox-Transformation (einschließlich der Festlegung des Lambdawerts) auf das Zielfeld angewendet wird.
Auf der Registerkarte Weitere Optionen können Sie zusätzliche Parameter für Zeiträume einstellen.
Startpunkt für Datenreihen (optional): Mit dieser Option können Sie den Startzeitraum der Zeitdatenreihe angeben, der im Prognosediagramm dargestellt wird. Wenn die Zielfeldhäufigkeit auf Stündlich, Täglich (jeden Tag) oder Täglich (nur Wochentage) eingestellt ist, steht diese Option nicht zur Verfügung.
Anzahl der für das Prognosediagramm zu berücksichtigenden Zeiträume: Mit dieser Option wird ein Diagramm erstellt, das die ursprünglichen Daten und mehrere künftige Prognosepunkte (zusammen mit Konfidenzintervallen von 80 % und 95 % um die Prognosepunkte) enthält. Sie können die Anzahl der künftigen Zeiträume angeben, für die eine Prognose erstellt werden soll.
Wochenformat auswählen: Mit dieser Option können Sie eine Methode zum Festlegen von Arbeitswochen auswählen. Diese Optionen beziehen sich darauf, was die erste Woche des Jahres darstellt und an welchem Wochentag eine Woche beginnt.
USA: Sonntag ist der erste Wochentag.
Großbritannien: Montag ist der erste Wochentag.
ISO8601: Montag ist der erste Wochentag.
Verwenden Sie die Registerkarte Diagrammoptionen, um die Steuerelemente für die grafische Ausgabe festzulegen.
Diagrammgröße: Wählen Sie Inch oder Zentimeter für die Diagrammgröße aus.
Diagrammauflösung: Wählen Sie die Diagrammauflösung in Punkten pro Inch aus: 1x (96 dpi), 2x (192 dpi) oder 3x (288 dpi).
Eine geringere Auflösung erzeugt eine kleinere Datei und eignet sich am besten für die Anzeige auf einem Bildschirm.
Eine höhere Auflösung erzeugt eine größere Datei mit einer besseren Druckqualität.
Größe der Basisschriftart (Punkte): Wählen Sie die Größe der Schrift im Diagramm aus.
Ausgabe anzeigen
O-Anker: Besteht aus einem Ausgabestrom, der das ARIMA-Modellobjekt enthält, das für Punkt-Prognosen und benutzerdefinierte Perzentile des Konfidenzintervalls, die diese Prognosen umgeben, verwendet werden kann.
R-Anker: Besteht aus den durch das ARIMA-Tool erzeugten Berichtsausschnitten: einer statistischen Zusammenfassung, diagnostischen Autokorrelationsdiagrammen und Prognosediagrammen.
I-Anker: Ein interaktives HTML-Dashboard, das aus Diagrammen und Metriken besteht. Wählen Sie die verschiedenen grafischen Elemente aus, um mit den Visualisierungen zu interagieren und weitere Informationen, Werte, Metriken und Analysen anzuzeigen.
Erwartetes Verhalten: Diagrammberechnungen
Das Prognosediagramm verwendet ein Standarddatum für Berechnungen, wenn eine der folgenden Konfigurationseinstellungen verwendet wird:
Zielfeldhäufigkeit ist auf Stündlich, Täglich (jeden Tag) oder Täglich (nur Wochentage) eingestellt.
Zielfeldhäufigkeit ist auf Wöchentlich, Monatlich, Vierteljährlich oder Jährlich eingestellt, und der Startpunkt für die Datenreihe ist nicht festgelegt.
Das Standarddatum kann variieren, wodurch die Berechnung zufällig erscheint.