Survival Analysis(生存分析)ツール
生存分析ツールは、生存分析の一般的な方法を実装します。生存モデルは、事象が発生するまでの時間(例えば、生命保険契約の失効)をモデル化します。生存モデルは、打ち切りを特徴とする点でユニークです。そのようなイベント(保険が失効する前に契約者が亡くなるなど)が発生する前にテストや試行が終了する可能性があります。
重要
このツールは、Alteryx Designer または R ツールでは自動的にインストールされません。このツールを使用するには、AlteryxコミュニティGalleryからダウンロードしてください。
このツールは、次の2つの目的(構成設定に基づいて決定)で使用できます。
データセットの「生存関数」(つまり、全人口の生存時間の分散を推定する)についての洞察を得ます。
特定の因子が集団の生存機能に影響を与えるかどうかを決定します(たとえば、群間の生存関数を比較する)。
ツールの設定
[必須パラメーター]タブを使用して、モデル生成のコントロールを設定します。
モデル名: 各モデルには、後で識別できるように名前を付ける必要があります。モデル名は文字で始まる必要があり、文字、数字、および特殊文字ピリオド(".")とアンダースコア("_")を含むことができます。その他の特殊文字は使用できません。Rは大文字と小文字を区別します。
入力タイプ: (データストリーム内のデータに応じて)次のいずれかを選択します。
Data contains durations(データに期間が含まれている): データには期間を表すフィールドが含まれます。
Select duration(期間変数を選択): 期間を表すフィールドを選択します。
Data contains start and stop times(データに開始時刻と終了時刻が含まれている) : データには開始時刻を表すフィールドと終了時刻を表すフィールドが含まれます。
Select start time/ left censor variable(開始時間/左検閲変数の選択): 開始時刻を表すフィールドを選択します。
Select end time/ right censor variable(終了時間/右検閲変数の選択: 終了時刻を表すフィールドを選択します。
検閲:
Data is left-censored(データを左検閲): データには、レコードの寿命の開始の0/1打ち切りを表すフィールドが含まれます。
Select left-censoring variable(左検閲変数を選択): 0/1変数を選択します。0は打ち切りを表し、1はレコードの寿命が開始時刻または0(「データを含む期間」が先に指定された)で始まったことを示します。
データを右検閲: データには、レコードの寿命の終わりの0/1切り捨てを表すフィールドが含まれます。
右検閲変数を選択: 0/1変数を選択します。0は打ち切りを表し、1はレコードの寿命が終了時刻または期間(「データに継続時間が含まれている」場合)で終了したことを示します。
[Analysis Option(分析オプション)]タブを使用して、解析の計算方法をより適切に定義します。
Kaplan-Meier推定: このオプションは、1つの変数ごとにグループ化するオプション付きのデータセットの生存曲線を検索します。
フィールドを選択: このオプションは、異なるグループの生存曲線の比較を可能にします。
グループ分け変数を選択: グループ分け変数に対応するフィールドを選択します。
信頼区間を使用: このオプションでは、KM推定値のプロット、およびそのテーブルの上限と下限が表示されます。
入力信頼レベル: KM推定値の上限と下限を計算するための信頼レベルを入力します。
Cox比例ハザード: 生存曲線に影響を及ぼす共変量の影響と重要性を確認するために使用します。
予測変数を選択: 少なくとも1つを選択する必要があります。
タイハンドリングのメソッド: 結ばれた時間に対処するメソッドです。**
ケースの重みを含める: このオプションを使用すると、各レコードの重みを含むフィールドを選択できます。
重みを指定するフィールドの選択: ケースの重みを含むフィールドを選択します。
[グラフィックスオプション]タブを使用して、グラフィカル出力のコントロールを設定します。
プロットサイズ: グラフのサイズをインチとセンチメートルのどちらにするかを選択します。
グラフの解像度: グラフの解像度を1インチあたりのドット数で選択します: 1x (96 dpi)、2x (192 dpi)、3x (288 dpi)解像度を低くするとファイルサイズが小さくなり、モニターでの表示に最適です。解像度を高くするとファイルサイズが大きくなり、印刷品質が向上します。
出力の表示
各出力アンカーに閲覧ツールを接続して、結果を表示します。
Oアンカー: モデル名とオブジェクトのサイズを持つ順番に並んだモデルのテーブルで構成されます。さまざまなモデルの利用可能性は、「分析オプション」の下の「分析タイプ」の選択に依存します。
要約分析 - Survオブジェクト、Kaplan-Meier推定オブジェクト
グループ分け分析 - Survオブジェクト、Kaplan-Meier推定オブジェクト、Cox比例ハザードオブジェクト
因子分析 - Survオブジェクト、Cox比例ハザードオブジェクト
Cox PHモデルは、O出力の出力の第2要素から直接アクセスすることができます。そのモデルが「モデル」である場合、SurvオブジェクトとKMestオブジェクトはそれぞれ「modelKMest」によってアクセスできます。
Rアンカー: [分析オプション]の下の[分析タイプ]の選択に応じて、Survival Analysis(生存分析)ツールで生成されたレポートスニペットで構成されます。
要約分析 - 要約統計と生存関数のグラフ。
グループ分け分析 - 要約統計量。観察されたもの対各グループの期待される結果。 Logrank、Likelihood Ratio、およびWaldテストのグループの類似性に関するグループ比較テスト結果。異なるグループの生存曲線を比較するグラフ。各グループの明確な生存曲線と累積ハザード曲線。
因子分析 - 要約統計量、Logrank、Likelihood Ratio、およびWaldテストの予測変数の影響に関する因子分析テスト結果。予測因子の影響を列挙するCox比例ハザードモデルの要約。
Dアンカー: 要約分析とグループ分け分析(この場合、予備のフィールドは追加された特定グループです)では、生存曲線のKaplan-Meier推定値が作成されます。因子分析用には、提供されていません。
*https://en.wikipedia.org/wiki/Survival_analysis **https://stat.ethz.ch/R-manual/R-devel/library/survival/html/coxph.html