Skip to main content

Survival Analysis Tool Icon Ereigniszeitanalyse-Tool

Das Tool „Ereigniszeitanalyse“ implementiert allgemeine Methoden der Ereigniszeitanalyse. Ereigniszeitmodelle modellieren die Zeit bis zum Eintreten eines Ereignisses (z. B. Storno einer Lebensversicherungspolice). Ereigniszeitmodelle sind dahingehend einzigartig, dass sie eine Zensierung beinhalten. Ein Test oder ein Testzeitraum kann vor dem Eintreten eines solchen Ereignisses enden (ein Policeninhaber kann beispielsweise versterben, bevor die Police storniert werden kann).

Wichtig

Dieses Tool wird nicht automatisch mit Alteryx Designer oder den R-Tools installiert. Um dieses Tool zu verwenden, laden Sie es aus der Alteryx Community Gallery herunter.

Dieses Tool kann für zwei Zwecke verwendet werden (je nach Konfigurationseinstellungen):

  1. zum Erlangen von Einblicken in die „Ereigniszeitfunktion“ eines Datensets (d. h. zur Schätzung einer Verteilung der Ereigniszeiten für eine Population)

  2. für die Bestimmung, ob bestimmte Faktoren die Ereigniszeitfunktion einer Population beeinflussen (z. B. zum gruppenübergreifenden Vergleich der Ereigniszeitfunktionen)

Tool-Konfiguration

Verwenden Sie die Registerkarte Erforderliche Parameter, um die Steuerelemente für die Modellgenerierung festzulegen.

  • Modellname: Jedes Modell muss über einen Namen verfügen, um das Modell später identifizieren zu können. Modellnamen müssen mit einem Buchstaben beginnen und dürfen Buchstaben, Zahlen und die Sonderzeichen Punkt („.“) und Unterstrich („_“) enthalten. Andere Sonderzeichen sind nicht erlaubt, und bei R wird zwischen Groß- und Kleinschreibung unterschieden.

  • Eingabetyp: Wählen Sie eine der folgenden Optionen aus (in Abhängigkeit von den Daten im Datenstrom).

    • Daten enthalten Dauer: Die Daten enthalten ein Feld, das die Dauer darstellt.

      • Dauervariable auswählen: Wählen Sie das Feld für die Dauer aus.

    • Daten enthalten Start- und Stoppzeiten: Die Daten enthalten ein Feld, das die Startzeiten darstellt, und ein Feld, das die Stoppzeiten darstellt.

      • Startzeit/linke Zensor-Variable auswählen: Wählen Sie das Feld aus, das die Startzeiten darstellt.

      • Endzeit/rechte Zensor-Variable auswählen: Wählen Sie das Feld aus, das die Endzeiten darstellt.

  • Zensierung:

    • Daten sind linkszensiert: Die Daten enthalten ein Feld, das eine 0/1-Zensierung des Lebensdauerstarts für den Datensatz repräsentiert.

      • Linkszensierte Variable auswählen: Wählen Sie eine 0/1-Variable aus, wobei 0 für die Zensierung steht und 1 angibt, dass die Lebensdauer eines Datensatzes mit der Startzeit oder bei 0 begonnen hat (sofern zuvor „Daten enthalten Dauern“ angegeben wurde).

    • Daten sind rechtszensiert: Die Daten enthalten ein Feld, das eine 0/1-Kürzung des Lebensdauerendes für den Datensatz repräsentiert.

      • Rechtszensierte Variable auswählen: Wählen Sie eine 0/1-Variable aus, wobei 0 für die Zensierung steht und 1 angibt, dass die Lebensdauer eines Datensatzes mit der Endzeit oder mit der Dauer geendet hat (sofern zuvor „Daten enthalten Dauern“ angegeben wurde).

Verwenden Sie die Registerkarte Analyseoptionen, um besser zu definieren, wie die Analyse berechnet wird.

  • Kaplan-Meier-Schätzung: Diese Option findet die Ereigniszeitkurve eines Datasets mit einer Option zum Gruppieren nach einer Variable.

    • Feld zur Gruppierung auswählen: Diese Option ermöglicht den Vergleich von Ereigniszeitkurven verschiedener Gruppen.

      • Gruppierungsvariable auswählen: Wählen Sie das Feld aus, das der Gruppierungsvariable entspricht.

    • Konfidenzintervall verwenden: Bei dieser Option werden Ober- und Untergrenzen für das Plotten der KM-Schätzung sowie in der zugehörigen Tabelle angezeigt.

      • Konfidenzstufe eingeben: Geben Sie die Konfidenzstufe ein, bei der die Ober- und Untergrenzen für die KM-Schätzung berechnet werden.

    • Proportionale Cox-Hazards: Verwenden Sie diese Option, um den Einfluss und die Bedeutung der Kovariaten anzuzeigen, die sich auf die Ereigniszeitkurve auswirken.

      • Prognosevariablen auswählen: Mindestens eine muss ausgewählt werden.

      • Methode für Verknüpfungsbehandlung: Die Methode zur Handhabung von verknüpften Zeiten.**

      • Fallgewichtung einschließen: Diese Option ermöglicht die Auswahl eines Feldes mit Gewichtungen für die einzelnen Datensätze.

        • Feld auswählen, das Gewichtungen angibt: Wählen Sie das Feld aus, das die Fallgewichtungen enthält.

Verwenden Sie die Diagramm-Optionen-Registerkarte, um die Steuerelemente für die grafische Ausgabe festzulegen.

  • Diagrammgröße: Wählen Sie Inch oder Zentimeter für die Diagrammgröße aus.

  • Diagrammauflösung: Wählen Sie die Diagrammauflösung in Punkten pro Inch aus: 1x (96 dpi), 2x (192 dpi) oder 3x (288 dpi). Eine geringere Auflösung erzeugt eine kleinere Datei und eignet sich am besten für die Anzeige auf einem Bildschirm. Eine höhere Auflösung erzeugt eine größere Datei mit einer besseren Druckqualität.

Ausgabe anzeigen

Verbinden Sie ein Durchsuchen-Tool mit jedem Ausgabeanker, um Ergebnisse anzuzeigen.

O-Anker: Umfasst eine Tabelle des serialisierten Modells mit dem Modellnamen und der Größe des Objekts. Die Verfügbarkeit verschiedener Modelle ist von der Auswahl der Option „Analysetyp“ unter „Analyseoptionen“ abhängig.

  • Zusammenfassungsanalyse – Ereigniszeitobjekt, Objekt der Kaplan-Meier-Schätzung

  • Gruppierungsanalyse – Ereigniszeitobjekt, Objekt der Kaplan-Meier-Schätzung, Cox-Regressionsobjekt

  • Faktoranalyse – Ereigniszeitobjekt, Cox-Regressionsobjekt

Der Zugriff auf das Cox-Regressionsobjektmodell ist direkt über das zweite Element der Ausgabe von Ausgabe O möglich. Wenn dieses Modell ‚model‘ lautet, ist der Zugriff auf die Surv- und KMest-Objekte über ‚model$surv‘ bzw. ‚model$KMest‘ möglich.

R-Anker: Besteht aus den vom Ereigniszeitanalyse-Tool generierten Berichtsausschnitten (je nach Auswahl für „Analysetyp“ unter „Analyseoptionen“).

  • Zusammenfassungsanalyse – Übersichtsstatistik und Diagramm der Ereigniszeitfunktion

  • Gruppierungsanalyse – Übersichtsstatistik; beobachtete und erwartete Ergebnisse für die einzelnen Gruppen im Vergleich; Gruppenvergleich-Testergebnisse für die Ähnlichkeit von Gruppen für Logrank-, Wahrscheinlichkeitsverhältnis- und Wald-Tests; Diagramm zum Vergleich von Ereigniszeitkurven verschiedener Gruppen und bestimmter Ereigniszeitkurven sowie kumulativer Gefahrenkurven für die einzelnen Gruppen

  • Faktoranalyse – Übersichtsstatistik; Faktoranalyse-Testergebnisse für die Auswirkung von Progosevariablen für Logrank-, Wahrscheinlichkeitsverhältnis- und Wald-Tests; Zusammenfassung des Cox-Regressionsmodells mit Einzelheiten zu den Auswirkungen der Prognosevariablen

D-Anker: Für die Zusammenfassungsanalyse und Gruppierungsanalyse (bei der ein Extrafeld mit einer Gruppenangabe hinzugefügt wird) ergibt sich daraus die Kaplan-Meier-Schätzung für die Ereigniszeitkurven. Für die Faktoranalyse wird diese Ausgabe nicht bereitgestellt.

*https://de.wikipedia.org/wiki/Ereigniszeitanalyse **https://stat.ethz.ch/R-manual/R-devel/library/survival/html/coxph.html