Vorbereitung

Stellen Sie den Feldtyp auf die kleinstmögliche Größe relativ zu den in der Spalte enthaltenen Daten ein.

Teilen Sie die Eingabedatensätze in zwei oder drei Zufallsstichproben auf.
![]() |
Ersetzen Sie Nullwerte, entfernen Sie Interpunktion, ändern Sie Groß- und Kleinschreibung und vieles mehr!
Tipp
Das Datenbereinigung-Pro-Tool ist nur über die AMP Engine verfügbar.

Beheben Sie häufige Datenqualitätsprobleme einschließlich Nullen und unerwünschter Zeichen. Groß- und Kleinschreibung ändern

Verwenden Sie das Filter-Tool, um Daten anhand einer Bedingung auszuwählen. Datenreihen, die die Bedingung erfüllen, werden am „True“-Anker ausgegeben.

Das Formel-Tool verwendet Ausdrücke zum Erstellen und Aktualisieren von Spalten.

Mit dem Zeilen-generieren-Tool werden neue Datenzeilen auf Datensatzebene erstellt.

Das Imputation-Tool ermöglicht es Benutzer:innen, Werte in numerischen Datenfeldern zu ersetzen.

Mit diesem Tool kann ein Benutzer für mehrere Felder einen Kachel- oder Binning-Vorgang ausführen.

Das Mehrfachfeld-Formel-Tool erstellt oder aktualisiert mehrere Felder anhand eines einzelnen Ausdrucks.

Dieses Tool verwendet Ausdrücke zum Erstellen und Aktualisieren von Spalten mithilfe von Zeilendaten zum Erstellen von Formeln.

Dieses Tool ermöglicht es, Daten mit hohem Anteil an negativen Antworten zu normalisieren.

Gibt eine zufällige Stichprobe des eingehenden Datenstroms zurück.
![]() |
Ordnen Sie die Daten zur weiteren Verarbeitung oder Ausgabe an.

Verwenden Sie das Datensatz-ID-Tool, um eine neue Spalte in den Daten zu erstellen und eine eindeutige Kennung zuzuweisen. Letztere wird sequentiell für jede Zeile in den Daten erhöht.

Dieses Tool beschränkt den Datenstrom auf eine spezifische Anzahl, einen Prozentsatz oder einen zufälligen Satz von Zeilen.

Dieses Tool gibt Datensätze und Datensatzbereiche zurück, die angegeben wurden,

Das Datenfelder-auswählen-Tool schließt Spalten von Daten, die einen Workflow durchlaufen, ein bzw. aus und ordnet sie neu an.

Verwenden Sie das Daten-sortieren-Tool, um die Zeilen in einer Tabelle in alphanumerischer Reihenfolge auf Grundlage der Werte der angegebenen Datenspalten anzuordnen.

Dieses Tool verwendet benutzerdefinierte Methoden, um einen Wert (Kachel) auf Grundlage von Bereichen in den Daten zuzuweisen.

Dieses Tool unterscheidet, ob ein Datensatz eindeutig oder ein Duplikat basierend auf angegebenen Feldern ist.