ZR-Füller-Tool
One-Tool-Beispiel
Es gibt ein One-Tool-Beispiel für ZR-Füller. Unter Beispiel-Workflows erfahren Sie, wie Sie dieses und viele weitere Beispiele direkt in Alteryx Designer aufrufen können.
Das ZR-Füller-Tool übernimmt einen Datenstrom mit Zeitreihendaten und füllt Lücken in den Reihen aus.
Dieses Tool wird primär als vorbereitender Schritt für die Verwendung nachgelagerter Tools und Makros für Zeitreihen verwendet. Bei einigen Zeitreihen-Tools kommt es zu unerwarteten Ergebnissen oder Fehlern, wenn der Datenstrom Lücken in den Zeitreihen enthält, z. B. wenn Sie eine Datenreihe besitzen, die Messwerte enthält, die alle 5 Minuten ermittelt werden sollen, die in der Datenreihe enthaltenen Messwerte jedoch nicht alle 5-Minuten-Intervalle abdecken. Verwenden Sie dieses Makro immer dann, wenn Sie den Verdacht haben, dass in Ihrem Datenstrom Lücken vorhanden sein könnten.
Anmerkung
Dieses Tool verwendet das R-Tool. Gehen Sie zu Optionen > Prognose-Tools herunterladen und melden Sie sich beim Alteryx Downloads and Licenses-Portal an, um R und die vom R-Tool verwendeten Pakete zu installieren. Gehen Sie zu Prognose-Tools herunterladen und verwenden.
Eingabe verbinden
Für das ZR-Füller-Tool ist ein Designer-Datenstrom erforderlich, der eine Spalte mit Datums- oder Datums-/Uhrzeitwerten enthält.
Tool-Konfiguration
Auf der Registerkarte Konfiguration können Sie die Steuerelemente für das Füllen der Zeitreihe einstellen.
Datum- oder Datum/Uhrzeitspalte auswählen: Wählen Sie die Datum- oder Datum/Uhrzeitspalte aus, die angibt, wann die Datenzeile erfasst wurde.
Intervall: Wählen Sie das Intervall aus, in dem die Zeitreihen gemessen werden. Zu den Optionen gehören: Minute, Stunde, Tag, Woche, Monat und Jahr.
Schrittweite: Wählen Sie die Schrittweite aus, die zwischen den einzelnen Zeiträumen der Zeitreihe liegt. Sie können die Schrittweite auf eine beliebige Ganzzahl zwischen 1 und 100 einstellen.
Beispiel
Um eine Serie zu generieren, die „Alle 3 Wochen“ abdeckt, setzen Sie Intervall auf „Woche“ und Schrittweite auf „3“.
Ausgabe anzeigen
Alle in das Makro eingegebenen Zeilen erscheinen in der Ausgabe. Darüber hinaus stellt das Makro fest, ob in den Zeitreihen Zeiträume fehlen, und erzeugt gegebenenfalls Zeilen, um die Lücken zu füllen.
Das Tool fügt an den eingehenden Datenstrom zwei Datenspalten an:
OriginalDateTime: Eine Spalte mit Datum/Uhrzeit, die den ursprünglichen, unveränderten Datum/Uhrzeit-Wert enthält.
FlagGeneratedRow: Eine boolesche Markierungsspalte, in der der Wert „Wahr“ anzeigt, dass die Datenzeile durch das Makro erzeugt wurde, um eine Lücke in der Zeitreihe zu füllen; „Falsch“ zeigt an, dass es sich um eine Quelldatenzeile handelt.
Für durch das Makro geleitete Quelldatenzeilen gilt:
In der Spalte „FlagGeneratedRow“ zeigt der Eintrag „Falsch“ an, dass es sich um eine Quelldatenspalte handelt, die nicht durch das Makro erzeugt wurde.
Die Spalte [IhreDatumUhrzeitSpalte] wird auf den entsprechenden Zeitraum gerundet. Weitere Informationen finden Sie unten im Abschnitt Benutzerdefiniertes Runden.
Alle anderen Quellspalten durchlaufen das Makro unverändert.
Für Zeilen, die erzeugt werden, um Lücken zu füllen, gilt:
In der Spalte „FlagGeneratedRow“ zeigt der Eintrag „Wahr“ an, dass es sich um eine durch das Makro erzeugte Spalte handelt und nicht um eine Quelldatenspalte.
In der Spalte [IhreDatumUhrzeitSpalte] befindet sich ein vom Makro erzeugter Datum- oder Datum/Uhrzeit-Wert, der die in der Zeitreihe gefundene Lücke füllt.
Alle anderen Spalten sind Null.
Zeitraumstart/-ende
Für die meisten gängigen Verwendungsszenarios werden Zeiträume von Zeitreihen wie folgt behandelt:
„Time-Level“: Für Intervalle
„Datumsebene“: Für Intervalle >= 1 Tag, der Zeitraum ist „Ende des Zeitraums“.
Rundung von Datum/Uhrzeit
Die einzige Änderung, die das Makro an den eingehenden Daten vornimmt, ist: Eine „Rundung“ wird auf [IhreDatumUhrzeitSpalte] angewendet. Diese Rundung basiert auf drei wesentlichen Elementen:
Intervall
Frühester Datum/Uhrzeitwert im Datenstrom
Schrittweite
Zuerst werden alle Bruchteile des ausgewählten Intervalls entfernt. Wenn Sie beispielsweise „Stunde“ als Intervall auswählen, werden alle Minuten und Sekunden vom Datum/Uhrzeitwert abgeschnitten, z. B.. 1:58 Uhr wird 1:00 Uhr.
Nach dem Entfernen der Bruchteile des ausgewählten Intervalls ermittelt das Makro die gültigen Zeiträume. Der in das Makro eingehende früheste Datum/Uhrzeitwert bildet die Grundlage der Zeitreihen. Um das obige Beispiel mit der „Stundendatenreihe“ fortzusetzen: Wenn die früheste Datums-/Uhrzeitangabe in der [IhreDatumUhrzeitSpalte] 13:58 Uhr ist, dann ist der erste Zeitraum 13:00 Uhr. Wenn die gewählte Schrittweite 5 ist, werden die nachfolgenden Zeiträume erzeugt, indem die gewählte Schrittweite von 5 Stunden zum vorherigen Zeitraum addiert wird, was in diesem Fall die Werte „13:00“, „18:00“, „23:00“ usw. ergibt.
Nachdem jetzt alle gültigen Zeiträume ermittelt wurden, werden zum Abschluss alle Datum/Uhrzeitwerte an den entsprechenden gültigen Zeitraum angepasst. Ein Rohwert von 5:59 Uhr in [IhreDatumUhrzeitSpalte] wird also 5:00 Uhr und 6:02 Uhr wird 6:00 Uhr usw.
Zeitraum-„Beschriftungen“
Nachdem das Makro alle Datum/Uhrzeitanpassungen durchgeführt hat, ist die daraus resultierende [IhreDatumUhrzeitSpalte] jetzt eine effektive „Beschriftung“ des Zeitraums. Der Datentyp ist jedoch eine Datum- oder Datum/Uhrzeit-Spalte (und keine Zeichenfolge) und ist daher als „Beschriftung“ gegebenenfalls nicht vollständig selbsterklärend. Daher ist es entscheidend, dass alle Bruchteile der Datum- oder Datum/Uhrzeitbeschriftung für das ausgewählte Intervall ignoriert werden. Wenn Ihr Intervall daher das Jahr ist, könnte ein Beispielzeitraum „2018-01-01“ sein, für die Beschriftung ist jedoch das Jahr entscheidend; die Bruchteile der Beschriftung – der Teil „01-01“ – sollten daher ignoriert werden, was bedeutet, dass der Zeitraum einfach nur das Jahr 2018 oder ein „beliebiger Zeitpunkt in 2018“ ist. Siehe Tabelle unten.
Datenerhaltung
Beachten Sie, dass das Makro – abgesehen von der oben beschriebenen Rundung von Datum/Uhrzeit – keine eingehenden Daten verändert. Es erfolgt kein Kombinieren, Summieren, Vereinheitlichen oder Validieren der eingehenden Daten. Aufgrund der Rundung des Datums besitzen jetzt jedoch mehrere Messungen in demselben Zeitraum dieselbe Zeitraumbeschriftung. Daher sind die Daten jetzt sauberer und können direkter summiert werden, da die Daten nach dieser konsistenten, gerundeten Zeitraumbeschriftung gruppiert werden können.
Sommerzeit
Beachten Sie, dass das Makro keine Sommerzeit berücksichtigt. Falls Sie daher Zeitreihendaten besitzen, in denen eine Zeitumstellung vorkommt, kann es sein, dass das Makro eine Stunden- oder Minutenzeile erzeugt, die für eine ungültige Stunde/Minute steht. In Regionen, die im März die Uhr um eine Stunde vorstellen, werden z. B. für die Stunde „2am“ des Tages der Zeitumstellung auf die Sommerzeit auch dann Zeilen erzeugt, wenn diese Stunde eigentlich nie existiert hat. Diese Stunde kann nach dem Makro einfach mit einem Filtertool entfernt werden.
Beispiel für einen Anwendungsfall
Zur Verdeutlichung zeigt die folgende Tabelle die verfügbaren Intervalloptionen mit dem zurückgegebenen Datentyp und der Information, ob es sich bei dem Zeitraum für diesen Intervalltyp um einen „Zeitraumstart“ oder ein „Zeitraumende“ handelt. Die Tabelle zeigt dann ein Beispiel für die Schrittweite und den ersten Rohwert in der Zeitreihe, um zu illustrieren, wie die resultierende Beschriftung des Zeitraums aussieht, sowie eine Beschreibung der Bedeutung der Beschriftung in englischer Sprache. Außerdem gibt die Tabelle an, welcher Teil der Zeitraumbeschriftung ignoriert werden soll, d. h. welche Teile Bruchteile des Intervalls sind.
Intervall | Zurückgegebener Datentyp | Zeitraumstart/-ende | Beispiel: Schrittweite | Beispiel: Erster Rohwert | Resultierende erste Zeitraumbeschriftung | Zeitraumbeschreibung | Auf Zeitraumbeschriftung ignorieren |
---|---|---|---|---|---|---|---|
Minute | Datum/Uhrzeit | Start | 2 | 2015-04-09 02:16:33 | 2015-04-09 02:16:00 | „The 2 minute period STARTING at 2:16, covering all of 2:16 and 2:17“ (Zeitraum: 2 Minuten, START: 2:16, Abdeckung: 2:16 und 2:17) | Sekunden |
Stunde | Datum/Uhrzeit | Start | 4 | 2015-04-09 02:16:33 | 2015-04-09 02:00:00 | „The 4 hour period STARTING at 2, covering all of the 2, 3, 4, and 5 o'clock hours.“ (Zeitraum: 4 Stunden, START: 2, Abdeckung: 2, 3, 4, und 5 Uhr) | Minuten oder kürzer |
Tag | Dattel | Ende | 6 | 2015-04-09 02:16:33 | 2015-04-09 | „The 6 day period ENDING on 4/9, covering all of 4/4 - 4/9.“ (Zeitraum: 6 Tage, ENDE: 9.4., Abdeckung: 4.4. – 9.4) | Stunden oder kürzer |
Woche | Dattel | Ende | 1 | 2015-04-09 02:16:33 | 2015-04-09 | „The 1 week period ENDING on 4/9, covering all of 4/3 - 4/9.“ (Zeitraum: 1 Woche, ENDE: 9.4., Abdeckung: 3.4. – 9.4) | Stunden oder kürzer |
Monat | Dattel | Ende | 3 | 2015-04-09 02:16:33 | 2015-04-01 | „The 3 month period ENDING in April, covering all of February, March, and April.“ (Zeitraum: 3 Monate, ENDE: April, Abdeckung: Februar, März und April) | Tage oder kürzer |
Jahr | Dattel | Ende | 2 | 2015-04-09 02:16:33 | 2015-04-01 | „The 2 year period ENDING in 2015, covering all of 2014 and 2015.“ (Zeitraum: 2 Jahre, ENDE: 2015, Abdeckung: 2014 und 2015) | Monate oder kürzer |