Skip to main content

Basic Data Profile Tool Icon Basisdatenprofil-Tool

One-Tool-Beispiel

Das Basisdatenprofil hat ein One-Tool-Beispiel. Unter Beispiel-Workflows erfahren Sie, wie Sie dieses und viele weitere Beispiele direkt in Alteryx Designer aufrufen können.

Verwenden Sie Basisdatenprofil, um einen Überblick oder ein Profil der Daten zu erhalten und die Informationen für weitere Analysen auszugeben. Das Tool „Basisdatenprofil“ analysiert Daten und stellt Metadaten für jede Spalte (Feld) mit Daten bereit. Wenn Sie zusätzlich zu den Metadaten eine visuelle Darstellung des Datenprofils anzeigen möchten, verwenden Sie ein Tool vom Typ Durchsuchen.

Tool-Konfiguration

Legen Sie die optionalen Konfigurationsoptionen fest:

  • Grenze für exakte Zählung: Für die beste Leistung wird der Standardgrenzwert empfohlen. Erhöhen Sie den Grenzwert, um Profilinformationen zu weiteren Daten anzuzeigen. Geben Sie Text ein oder verwenden Sie die Schaltflächen nach oben/unten, um die maximale Anzahl der eindeutigen Werte auszuwählen, die Alteryx in den Daten identifizieren soll.

  • Größenbegrenzung für die Rückgabe aller eindeutigen Werte (Zeichen): Für die beste Leistung wird die Standardgrenze empfohlen. Erhöhen Sie den Grenzwert, um Profilinformationen zu weiteren Daten anzuzeigen. Geben Sie Text ein, oder wählen Sie mit den Aufwärts-/Abwärtstasten die maximale Anzahl von Zeichen aus, die Alteryx in einem Wert prüfen soll, um festzustellen, ob der Wert eindeutig ist.

  • Metrische Einheiten verwenden: Wählen Sie diese Option, um metrische Maßeinheiten zu verwenden. Diese Option gilt nur für Geodaten.

Ausgabe anzeigen

Die Datenprofilinformationen im Ergebnisfenster variieren je nach Datentyp aus dem Verbindungstool. Unter Datentypen finden Sie eine Liste der Datentypen.

Die Ergebnisse werden vertikal aufgelistet. Führen Sie einen Bildlauf durch, um die Metadaten für die einzelnen Spalten in den Daten anzuzeigen.

Zeichenfolgendaten

Wenn eine Spalte Zeichenkettenwerte enthält, werden diese Metadaten bereitgestellt:

  • Name: Der Spaltenname.

  • Datentyp: Der Datentyp der ausgewählten Spalte.

  • Größe: Die Größe des Speichers, die für jeden Datensatz in dieser Spalte reserviert ist.

  • Quelle: Der Ursprung der Spalte. Dabei kann es sich um den Namen der Datenquelle oder den Pfad zum Speicherort der Daten handeln.

  • Beschreibung: Die Beschreibung der Spalte, sofern verfügbar. Wenn keine Beschreibung verfügbar ist, lautet sie [Null].

  • OKs: Die Anzahl der Werte in der Spalte ohne erkennbares Qualitätsproblem, z. B. führende oder nachgestellte Leerzeichen.

  • Nullen: Die Anzahl der Werte in der Spalte, die null sind, ausschließlich leere Werte.

  • Nicht-Null: Die Anzahl der Nicht-Null-Einträge in der Spalte, einschließlich leerer Werte.

  • Leerzeichen: Die Anzahl der leeren Werte.

  • Werte mit führendem Leerzeichen: Die Anzahl der Zeichenfolgenwerte mit Leerzeichen vor dem Wert. Mit dem Datenbereinigung-Tool oder der „Trim"-Funktion des Formel-Tools können Sie dieses Problem beheben. Weitere Informationen finden Sie unter Datenbereinigungs-Tool und Formel-Tool.

  • Werte mit nachfolgendem Leerzeichen: Die Anzahl der Zeichenfolgenwerte mit Leerzeichen nach dem Wert.

  • Werte mit beiden Leerzeichen: Die Anzahl der String-Werte mit Leerzeichen vor und/oder nach dem Wert.

  • Durchschnittslänge: Die Durchschnittslänge der Werte in der Spalte.

  • Längste Länge: Die Anzahl der Zeichen im längsten Wert in der Spalte.

  • Längster Wert: Der längste Wert in der Spalte.

  • Kürzeste (nicht leere) Länge: Die Anzahl der Zeichen im kürzesten Wert in der Spalte.

  • Kürzester Wert: Der kürzeste Wert in der Spalte.

  • Minimum: Der erste Zeichenfolgeneintrag in einer Spalte, die alphabetisch sortiert ist.

  • Maximum: Der letzte Zeichenfolgeneintrag in einer Spalte, die alphabetisch sortiert ist.

  • Einmalig: Die Anzahl der einmaligen Werte im Feld. Verwenden Sie das Einmalig-Tool, um die gesamte Anzahl von einmaligen und doppelten Einträgen zu sehen. Weitere Informationen finden Sie unter Einmalig-Tool.

  • Eindeutige Werte: Alle eindeutigen Werte in der Spalte.

Numerische Daten

Wenn eine Spalte numerische Werte enthält, werden diese Metadaten bereitgestellt:

  • Name: Der Spaltenname.

  • Datentyp: Der Datentyp der ausgewählten Spalte.

  • Größe: Die Größe des Speichers, die für jeden Datensatz in dieser Spalte reserviert ist.

  • Quelle: Der Ursprung der Spalte. Dabei kann es sich um den Namen der Datenquelle oder den Pfad zum Speicherort der Daten handeln.

  • Beschreibung: Die Beschreibung der Spalte, sofern verfügbar. Wenn keine Beschreibung verfügbar ist, lautet sie [Null].

  • OKs: Die Anzahl der Werte in der Spalte ohne erkennbares Qualitätsproblem, z. B. führende oder nachgestellte Leerzeichen.

  • Nullen: Die Anzahl der Werte in der Spalte, die null sind, ausschließlich leere Werte.

  • Nicht-Null: Die Anzahl der Nicht-Null-Einträge in der Spalte, einschließlich leerer Werte.

  • Minimum: Der kleinste Wert in der Spalte.

  • Maximum: Der größte Wert in der Spalte.

  • Durchschnitt: Der Durchschnittswert der Werte in der Spalte.

  • Summe: Die Summe der Werte in der Spalte.

  • Standardabweichung: Die Kennzahl dazu, wie weit die Werte im Diagramm voneinander abweichen.

  • Varianz: Die Kennzahl dazu, wie weit ein Satz zufälliger Zahlen vom Mittelwert abweicht.

  • Einmalig: Die Anzahl der einmaligen Werte im Feld. Verwenden Sie das Einmalig-Tool, um die gesamte Anzahl von einmaligen und doppelten Einträgen zu sehen. Weitere Informationen finden Sie unter Einmalig-Tool.

  • Eindeutige Werte: Alle eindeutigen Werte in der Spalte.

  • 25. Perzentil: Der Median der unteren oder ersten Hälfte der Daten.

  • 50. Perzentil: Der Median der Daten.

  • 75. Perzentil: Der Median der oberen oder zweiten Hälfte der Daten.

  • Histogramm: Die Anzahl Werte in der Spalte, die unter gleichmäßig gruppierte Daten fallen. Jede Gruppe wird durch einen Startwert und eine Anzahl Werte in der Gruppe mit Trennung durch einen Doppelpunkt angegeben. Eine Gruppe enthält Werte bis zum Startwert der nächsten Gruppe, ohne diesen jedoch einzuschließen. 1:23, 2:15, 3:0 gibt drei Gruppen an, die mit 1, 2 und 3 starten. Die einzelnen Gruppen enthalten 23, 15 und 0 Elemente.

  • Fehlerquote: Der mögliche Wertebereich unter- und oberhalb des berechneten Werts.

Datums-/Uhrzeitdaten

Wenn eine Spalte Datums-/Uhrzeitdaten enthält, werden diese Metadaten bereitgestellt:

  • Name: Der Spaltenname.

  • Datentyp: Der Datentyp der ausgewählten Spalte.

  • Größe: Die Größe des Speichers, die für jeden Datensatz in dieser Spalte reserviert ist.

  • Quelle: Der Ursprung der Spalte. Dabei kann es sich um den Namen der Datenquelle oder den Pfad zum Speicherort der Daten handeln.

  • Beschreibung: Die Beschreibung der Spalte, sofern verfügbar. Wenn keine Beschreibung verfügbar ist, lautet sie [Null].

  • OKs: Die Anzahl der Werte in der Spalte ohne erkennbares Qualitätsproblem, z. B. führende oder nachgestellte Leerzeichen.

  • Nullen: Die Anzahl der Werte in der Spalte, die null sind, ausschließlich leere Werte.

  • Nicht-Null: Die Anzahl der Nicht-Null-Einträge in der Spalte, einschließlich leerer Werte.

  • Datumshistogramm: (Nur für die Daten zum Datum) Die Anzahl Werte in der Spalte, die unter gleichmäßig gruppierte Daten fallen. Jede Gruppe wird durch einen Startwert und eine Anzahl Werte in der Gruppe mit Trennung durch einen Doppelpunkt angegeben. Eine Gruppe enthält Werte bis zum Startwert der nächsten Gruppe, ohne diesen jedoch einzuschließen. 1:23, 2:15, 3:0 gibt drei Gruppen an, die mit 1, 2 und 3 starten. Die einzelnen Gruppen enthalten 23, 15 und 0 Elemente.

  • Minimum: Der kleinste Wert in der Spalte.

  • Maximum: Der größte Wert in der Spalte.

  • Einmalig: Die Anzahl der einmaligen Werte im Feld. Verwenden Sie das Einmalig-Tool, um die gesamte Anzahl von einmaligen und doppelten Einträgen zu sehen. Weitere Informationen finden Sie unter Einmalig-Tool.

  • Eindeutige Werte: Alle eindeutigen Werte in der Spalte.

Geo-Objektdaten

Wenn eine Spalte Geo-Objekte enthält, werden die folgenden Metadaten bereitgestellt:

  • Name: Der Spaltenname.

  • Datentyp: Der Datentyp der ausgewählten Spalte.

  • Größe: Die Größe des Speichers, die für jeden Datensatz in dieser Spalte reserviert ist.

  • Quelle: Der Ursprung der Spalte. Dabei kann es sich um den Namen der Datenquelle oder den Pfad zum Speicherort der Daten handeln.

  • Beschreibung: Die Beschreibung der Spalte, sofern verfügbar. Wenn keine Beschreibung verfügbar ist, lautet sie [Null].

  • OKs: Die Anzahl der Werte in der Spalte, bei denen keine Qualitätsprobleme festgestellt wurden.

  • Nullen: Die Anzahl der Werte in der Spalte, die null sind, ausschließlich leere Werte.

  • Nicht-Null: Die Anzahl der Nicht-Null-Einträge in der Spalte, einschließlich leerer Werte.

  • Durchschnittliche Größe (Bytes): Die durchschnittliche Arbeitsspeichergröße, die dieses Objekt belegt.

  • Größte Größe (Bytes): Die Arbeitsspeichergröße, die das größte Objekt in der Spalte belegt.

  • Zählpunkt: Die Anzahl der Geo-Objekte in der Spalte, die Punkte darstellen.

  • Zähllinie: Die Anzahl der Geo-Objekte in der Spalte, die Linien darstellen.

  • Zählung PolyPolyline: Die Anzahl der Geo-Objekte in der Spalte, die Polylinien darstellen.

  • Zählrechteck: Die Anzahl der Geo-Objekte in der Spalte, die Rechtecke darstellen.

  • Zählpolygon: Die Anzahl der Geo-Objekte in der Spalte, die Polygone darstellen.

  • Zählmultipunkt: Die Anzahl der Geo-Objekte in der Spalte, die Multipunkte darstellen.

  • Durchschnittliche Anzahl von Teilen: Die durchschnittliche Anzahl der Teile in den Geo-Objekten innerhalb der Spalte.

  • Größte Anzahl von Teilen: Die größte Anzahl der Teile in den Geo-Objekten innerhalb der Spalte.

  • Durchschnittliche Anzahl von Punkten: Die durchschnittliche Anzahl der Punkte in den Geo-Objekten innerhalb der Spalte.

  • Größte Anzahl von Punkten: Die größte Anzahl der Punkte in den Geo-Objekten innerhalb der Spalte.

  • Längste Länge: Die längste Länge in den Geo-Objekten innerhalb der Spalte.

  • Größter Bereich: Der größte Bereich in Quadratmeilen oder Quadratkilometern.