Skip to main content

Score Tool Bewertung-Tool

One-Tool-Beispiel

Für Bewertung gibt es ein One-Tool-Beispiel. Unter Beispiel-Workflows erfahren Sie, wie Sie dieses und viele weitere Beispiele direkt in Alteryx Designer aufrufen können.

Das Bewertung-Tool erstellt eine Schätzung eines Ziels, durch Anwendung eines R-Modells auf eine Reihe von angegebenen Prädiktorvariablen. Wenn die Zielvariable kategorial ist, liefert sie Wahrscheinlichkeiten, dass ein Datensatz (basierend auf der Prädikatorvariablen) zu jeder Kategorie gehört. Wenn die Zielvariable fortlaufend ist, wird der Wert der Zielvariablen geschätzt. Auch wenn es verwendet werden kann, um die Leistung des Modells zu bewerten, geschieht dies nicht von allein.

Dieses Tool verwendet das R-Tool. Navigieren Sie zu Optionen > Prognose-Tools herunterladen und melden Sie sich beim Alteryx Downloads and Licenses-Portal an, um R und die vom R-Tool verwendeten Pakete zu installieren. Siehe Prognose-Tools herunterladen und verwenden.

Modelltyp

Das Tool „Bewertung“ kann die meisten Modelle von einer Reihe von Speicherorten bewerten:

  • Lokales Modell: Das Modell wird von einem lokalen Computer aus in den Workflow integriert oder der Zugriff erfolgt innerhalb einer Datenbank.

  • Promote-Modell: Das Modell ist im Promote-Modellmanagementsystem gespeichert.

Konfigurieren des lokalen Modells

Das Tool „Bewertung“ kann für Modelle konfiguriert werden, auf die über einen Standard-Workflow zugegriffen wird, oder für Modelle, auf die über die In-DB-Suite zugegriffen wird.

Tool-Konfiguration für die Standardausführung

Eingaben verbinden

Das Bewertung-Tool erfordert zwei Eingaben:

  • Das Modellobjekt, das in einem R-basierten Prognosetool erstellt wurde.

  • Einen Datenstrom, der die bei der Modellkonfiguration ausgewählten Prognosefelder enthält. Dies kann ein standardmäßiger Alteryx-Datenstrom oder ein XDF-Metadatenstrom sein.

Verbinden Sie diese beiden Eingaben mit der Eingabe des Tools „Bewertung“, um mit der Konfiguration zu beginnen.

Unterstützte Modelle

Das Tool „Bewertung“ kann einen Alteryx-Standarddatenstrom aus einem Prognosemodell verwenden, auch wenn er mit einer RevoScaleR-Funktion geschätzt wurde. Das Bewertung-Tool kann einen XDF-Metadatenstrom nur dann verwenden, wenn die Eingabe in das Modellierung-Tool entweder von einem XDF-Ausgabe-Tool oder einem XDF-Eingabe-Tool stammt und das Modell mit einer RevoScaleR-Funktion geschätzt wurde.

Mit Oracle R Enterprise und einem mit einer Oracle-Datenquelle verbundenen In-DB-Prognose-Tool geschätzte Modelle können nicht verwendet werden, um einen standardmäßigen Alteryx-Datenstrom zu bewerten, obwohl mit einem standardmäßigen Alteryx-Datenstrom geschätzte Modelle verwendet werden können, um Oracle-Datenquellen zu bewerten.

Konfiguration

Die Anpassungen, die mit dieser Option vorgenommen werden, sind nur gültig, wenn das Ziel eine binäre kategoriale Variable ist.

  • Der neue Feldname (kontinuierliches Ziel) oder das Präfix (kategoriales Ziel): Der Feldname oder das Präfix muss mit einem Buchstaben beginnen und darf Buchstaben, Zahlen und den Sonderzeichen-Punkt („.“) sowie den Unterstrich („_“) enthalten. Bei R wird zwischen Groß- und Kleinschreibung unterschieden.

  • Das Zielfeld enthält einen überrepräsentierten Wert: Diese Felder werden verwendet, um die festgesetzte Wahrscheinlichkeit an die Prozentsätze der wahren Stichproben anzupassen. Wählen Sie aus, was bereitgestellt werden soll:

    • Der Wert des überrepräsentierten Zielfelds: Der Name des überrepräsentierten Zielfelds.

    • Der Prozentsatz des überrepräsentierten Werts in den ursprünglichen Daten vor dem Oversampling: Der Prozentsatz der Werte, die beim Oversampling wiederholt wurden.

  • Nicht regularisierte Optionen für „Nur lineare Regression“:

    Von ORE erstellte Modelle

    Wenn ein durch ORE erstelltes Modell verwendet wird, muss die Originaltabelle der Schätzungen in der Datenbank vorhanden sein, damit Konfidenzintervalle berechnet werden können.

    • Das Zielfeld wurde durch natürliches Logarithmieren transformiert: Wählen Sie diese Option aus, um eine Transformation, die die Werte wieder an die ursprüngliche Skala anpasst, und einen Smearing-Schätzer, der die anschließenden Transformierungstendenzen berücksichtigt, anzuwenden.

    • Prognose-Konfidenzintervall einschließen: Wählen Sie diese Option aus, um den Wert anzugeben, der zur Berechnung der Konfidenzintervalle verwendet werden soll.

  • Für XDF-Eingabe spezifische Optionen:

    • Bewertungen an die Eingabe-XDF-Datei anhängen: Wählen Sie diese Option aus, um Bewertungen an die XDF-Eingabedatei anzuhängen, anstatt sie in einem Alteryx-Datenstrom zu platzieren.

  • Die Anzahl der gleichzeitig zu bewertenden Datensätze: Wählen Sie die Anzahl der Datensätze in einer Gruppe aus. Die Eingabedaten werden gruppenweise bewertet, um die in R geltende Einschränkung für die Verarbeitung im Speicher zu vermeiden.

Tools für In-DB-Verarbeitung konfigurieren

Das Tool „Bewertung“ unterstützt die datenbankinterne Verarbeitung in Oracle, Microsoft SQL Server 2016 und Teradata. Weitere Informationen zu In-DB-Support und -Tools finden Sie unter In-Datenbank – Übersicht.

So greifen Sie auf die In-DB-Version des Tools „Bewertung“ zu:

  • Platzieren Sie ein In-DB-Tool auf dem Canvas. Das Tool „Bewertung“ ändert die In-DB-Version automatisch.

  • Klicken Sie mit der rechten Maustaste auf das Bewertung-Tool, zeigen Sie auf „Tool-Version auswählen“ und wählen Sie die In-DB-Version aus.

Weitere Informationen zur Unterstützung von In-DB-Prognosen finden Sie unter Predictive Analytics.

Eingabe verbinden

Das Bewertung-Tool erfordert zwei Eingaben:

  • Das Modellobjekt, das in einem R-basierten Prognosetool erstellt wurde.

  • Einen Datenstrom, der die bei der Modellkonfiguration ausgewählten Prognosefelder enthält. Dies kann ein standardmäßiger Alteryx-Datenstrom oder ein XDF-Metadatenstrom sein.

Verbinden Sie diese beiden Eingaben mit der Eingabe des Tools „Bewertung“, um mit der Konfiguration zu beginnen.

Unterstützte Modelle

Das Tool „Bewertung“ kann einen Alteryx-Standarddatenstrom aus einem Prognosemodell verwenden, auch wenn er mit einer RevoScaleR-Funktion geschätzt wurde. Das Bewertung-Tool kann einen XDF-Metadatenstrom nur dann verwenden, wenn die Eingabe in das Modellierung-Tool entweder von einem XDF-Ausgabe-Tool oder einem XDF-Eingabe-Tool stammt und das Modell mit einer RevoScaleR-Funktion geschätzt wurde.

Mit ORE und einem mit einer Oracle-Datenquelle verbundenen In-DB-Prognose-Tool geschätzte Modelle können nicht verwendet werden, um einen standardmäßigen Alteryx-Datenstrom zu bewerten, obwohl mit einem standardmäßigen Alteryx-Datenstrom geschätzte Modelle verwendet werden können, um Oracle-Datenquellen zu bewerten.

Konfiguration

Andere Sonderzeichen sind nicht erlaubt, und bei R wird zwischen Groß- und Kleinschreibung unterschieden.

  • Ausgabetabellenname: Geben Sie den Namen der Tabelle ein, in der die Ergebnisse in der Datenbank gespeichert werden.

  • Der neue Feldname (kontinuierliches Ziel) oder das Präfix (kategoriales Ziel): Der Feldname oder das Präfix muss mit einem Buchstaben beginnen und darf Buchstaben, Zahlen und den Sonderzeichen-Punkt („.“) sowie den Unterstrich („_“) enthalten.

  • Das Zielfeld enthält einen überrepräsentierten Wert: Diese Felder werden verwendet, um die festgesetzte Wahrscheinlichkeit an die Prozentsätze der wahren Stichproben anzupassen. Die Anpassungen, die mit dieser Option vorgenommen werden, sind nur gültig, wenn das Ziel eine binäre kategoriale Variable ist. Wählen Sie aus, was bereitgestellt werden soll:

    • Der Wert des überrepräsentierten Zielfelds: Der Name des überrepräsentierten Zielfelds.

    • Der Prozentsatz des überrepräsentierten Werts in den ursprünglichen Daten vor dem Oversampling: Der Prozentsatz der Werte, die beim Oversampling wiederholt wurden.

  • Optionen nur für die lineare Regression:

    Von ORE erstellte Modelle

    Wenn ein durch ORE erstelltes Modell verwendet wird, muss die Originaltabelle der Schätzungen in der Datenbank vorhanden sein, damit Konfidenzintervalle berechnet werden können.

    • Das Zielfeld wurde durch natürliches Logarithmieren transformiert: Wählen Sie diese Option aus, um eine Transformation, die die Werte wieder an die ursprüngliche Skala anpasst, und einen Smearing-Schätzer, der die anschließenden Transformierungstendenzen berücksichtigt, anzuwenden.

    • Prognose-Konfidenzintervall einschließen: Wählen Sie diese Option aus, um den Wert anzugeben, der zur Berechnung der Konfidenzintervalle verwendet werden soll.

  • Teradata-spezifische Konfiguration: Microsoft Machine Learning Server benötigt zusätzliche Konfigurationsinformationen über die spezielle zu verwendende Teradata-Plattform. Diese Informationen werden normalerweise von einem lokalen Teradata-Administrator bereitgestellt.

    • Die Teradata-Serverpfade zu den binären ausführbaren Dateien von R.

    • Den Speicherort, an den temporäre Dateien geschrieben werden sollen, der von Microsoft Machine Learning Server verwendet wird.

Modellquelle (nur Oracle)

  • Modellquelle: Wählen Sie die Quelle des Modellobjekts aus, das an Eingang (M) des Bewertung-Tools weitergeleitet wird. Sie kann sich an folgenden Orten befinden:

    • In der Datenbank, wo sie durch den Wert im Feld „Name“ des Datenstroms gekennzeichnet ist.

    • Im Feld „Objekt“ des Datenstroms.

Ausgabe anzeigen

Die Ausgabe beinhaltet die Originaldatenströme mit den prognostizierten Werten des Modells. Im Fall eines Modells, das ein kategoriales Ziel verwendet, wird eine prognostizierte Wahrscheinlichkeit der einzelnen Stufen der Zielvariablen bereitgestellt, wobei dem Feldnamen das vom Benutzer angegebene Präfix vorangestellt wird und das Suffix des Felds der möglichen Stufe der Zielvariablen entspricht.

Konfigurieren für das Promote-Modell

Promote ist eine Plattform, über die Prognosemodelle bereitgestellt, verwaltet und skaliert werden. Alteryx kann eine Verbindung mit der Promote-Plattform herstellen, um auf die gespeicherten Modelle zuzugreifen und sie für Bewertungen heranzuziehen.

Promote-Anmeldedaten

  • Stellen Sie eine Alteryx Promote-Verbindung her.

  • Alteryx Promote-Verbindung: Eine Drop-Down-Liste, die zur Auswahl aus gespeicherten Promote-Verbindungen verwendet wird.

  • Verbindung hinzufügen: Eine Option, um der Liste der verfügbaren Promote-Verbindungen eine Verbindung hinzuzufügen. Der Promote-Verbindungs-Manager funktioniert unabhängig von den Workflows.

Promote-Verbindung hinzufügen

  1. Klicken Sie auf Verbindung hinzufügen.

  2. Geben Sie im Fenster „Verbindung hinzufügen“ eine Alteryx Promote URL ein, und zwar eine URL, die auf den Ort hinweist, an dem Ihr Modell gespeichert ist.

  3. Wählen Sie Weiter aus.

  4. Geben Sie im Fenster „Alteryx Promote-Anmeldedaten“ Ihren Benutzernamen und API-Schlüssel ein.

  5. Wählen Sie Verbinden aus.

  6. Wird die Verbindung erfolgreich erstellt, wählen Sie im Fenster „Verbindung hergestellt“ Beenden aus. Die neue Verbindung wird ausgewählt und erscheint im Dropdown.

Promote-Verbindung löschen

  1. Wählen Sie eine verfügbare Verbindung aus.

  2. Wählen Sie Verbindung entfernen aus.

  3. Prüfen Sie im Fenster „Bestätigung“, dass URL und Benutzername der Verbindung zugeordnet sind, die Sie löschen möchten.

  4. Wählen Sie OK. Die Verbindung erscheint nicht mehr im Dropdown-Menü.

Zugang zu Promote

Wenn Sie sich nicht sicher sind, ob Sie Zugang zu der Promote-Funktion haben oder Hilfe benötigen, um Ihre erforderlichen Anmeldeinformationen zu finden, wenden Sie sich an Ihren lokalen Administrator oder Ihren Kundendienstvertreter.

Modellauswahl

Es wird eine Liste der Modelle erstellt, auf die Sie zugreifen können. Scrollen Sie durch die Liste oder verwenden Sie die Suchfunktion, um nach dem Modell zu suchen, das Sie bewerten möchten, und wählen Sie den Modellpfad aus.

Wenn ein Modellpfad ausgewählt wurde, werden die Informationen über das Modell ausgefüllt.

  • Name: Der Modellname.

  • Besitzer: Der Eigentümer des Modells.

  • Status: Der aktuelle Status des Modells, aus dem hervorgeht, ob darauf zugegriffen werden kann.

    • Online: Das Modell ist aktuell und kann zur Verarbeitung von Daten verwendet werden.

    • Erstellung: Das Modell wird zurzeit aktualisiert und kann keine Daten verarbeiten.

    • Einheitentest nicht bestanden: Die Erstellung des Modells ist abgeschlossen, aber Komponenten wurden nicht korrekt erstellt. Das Modell kann keine Daten verarbeiten.

    • Fehlgeschlagen: Das Modell wurde nicht korrekt erstellt und kann keine Daten verarbeiten.

    • Offline: Das Modell wurde nicht erstellt und kann keine Daten verarbeiten.

  • Letzte Aktualisierung: Der Zeitstempel der letzten Modellerstellung.

Vergewissern Sie sich, dass das Modell für die Verarbeitung von Daten verfügbar ist, und wählen Sie Fertig aus.

Konfigurationszusammenfassung

In der Konfigurationsübersicht finden Sie eine Übersicht über die verwendeten Anmeldeinformationen und die Modellübersicht des ausgewählten Modells.