Survival Analysis(生存分析)ツール
生存分析ツールは、生存分析の一般的な方法を実装します。生存モデルは、事象が発生するまでの時間(例えば、生命保険契約の失効)をモデル化します。生存モデルは、打ち切りを特徴とする点でユニークです。その事象が発生する前に、(例えば保険が失効する前に契約者が亡くなるなどの理由で)テストや試行が終了する可能性があります。
重要
このツールは、Designerでは自動的にインストールされません。使用するには、Alteryxライセンス&ダウンロードポータルからお使いのAlteryx DesignerのバージョンのAlteryx予測ツールセットをダウンロードしてインストールします。
詳細については、予測ツールセットのダウンロードと使用を参照してください。
重要
このツールは、Alteryx Designer または R ツールでは自動的にインストールされません。このツールを使用するには、AlteryxコミュニティGalleryからダウンロードしてください。
このツールは、次の2つの目的(構成設定に基づいて決定)で使用できます。
データセットの「生存関数」を把握する(つまり、集団全体の生存時間の分散を推定する)。
特定の因子が集団の生存関数に影響を与えるかどうかを決定する(たとえば、グループ間の生存関数を比較する)。
ツールの設定
[必須パラメーター]タブを使用して、モデル生成のコントロールを設定します。
モデル名: 各モデルには、後で識別できるように名前を付ける必要があります。モデル名は文字で始まる必要があり、文字、数字、および特殊文字のピリオド(.)とアンダースコア(_)を含めることができます。その他の特殊文字は使用できません。Rは大文字と小文字を区別します。
入力オプション: (データストリーム内のデータに応じて)次のいずれかを選択します。
Data contains durations (データに期間が含まれている): データには期間を表すフィールドが含まれます。
Select duration(期間変数を選択): 期間を表すフィールドを選択します。
Data contains start and stop times(データに開始時刻と終了時刻が含まれている): データには開始時刻を表すフィールドと終了時刻を表すフィールドが含まれます。
Select start time/left censor variable(開始時間/左側打ち切り変数の選択): 開始時刻を表すフィールドを選択します。
Select end time/right center variable(終了時間/右側打ち切り変数の選択): 終了時刻を表すフィールドを選択します。
打ち切り
Data is left-censored(左側打ち切り): データには、レコードの寿命の開始の0/1打ち切りを表すフィールドが含まれます。
Select left-censoring variable(左側打ち切り変数を選択): 0/1変数を選択します。0は打ち切りを表し、1はレコードの寿命が開始時刻または0 (「Data contains durations」が先に指定されている場合)で始まったことを示します。
Data is right-censored(右側打ち切り): データには、レコードの寿命の終わりの0/1切り捨てを表すフィールドが含まれます。
Select right-censoring variable(右側打ち切り変数を選択): 0/1変数を選択します。0は打ち切りを表し、1はレコードの寿命が終了時刻または期間(「Data contains durations」が先に指定されている場合)で終了したことを示します。
[Analysis Option(分析オプション)]タブを使用して、解析の計算方法をより適切に定義します。
Kaplan-Meier Estimate(推定): このオプションは、データセットの生存曲線を求めます。1つの変数でグループ分けすることも可能です。
フィールドを選択: このオプションは、異なるグループの生存曲線の比較を可能にします。
Choose field to group by(グループ分け変数を選択): グループ分け変数に対応するフィールドを選択します。
Use confidence interval(信頼区間を使用): このオプションでは、KM推定量のプロットおよびそのテーブルの上限と下限が表示されます。
Input Confidence Level(信頼レベルを入力): KM推定量の上限と下限を計算するための信頼レベルを入力します。
Cox Proportional Hazards(Cox比例ハザード): 生存曲線に影響を及ぼす共変量の影響と重要性を確認するために使用します。
Select predictor variables(予測変数を選択): 少なくとも1つ選択する必要があります。
Method for tie handling(タイの処理方法): タイの場合の処理メソッドです。**
Include case weights(ケースの重みを含める): このオプションを使用すると、各レコードに対して重みを含むフィールドを選択できます。
重みを指定するフィールドの選択: ケースの重みを含むフィールドを選択します。
[グラフィックスオプション]タブを使用して、グラフィカル出力のコントロールを設定します。
プロットサイズ: グラフのサイズをインチとセンチメートルのどちらにするかを選択します。
グラフの解像度: グラフの解像度を 1 インチあたりのドット数で選択します: 1x (96 dpi)、2x (192 dpi)、3x (288 dpi)
解像度を低くするとファイルサイズが小さくなり、モニターでの表示に最適です。
解像度を高くするとファイルサイズが大きくなり、印刷品質が向上します。
出力の表示
各出力アンカーに閲覧ツールを接続して、結果を表示します。
Oアンカー: モデル名とオブジェクトのサイズで順に並んだモデルのテーブルで構成されます。利用可能なモデルは、「分析オプション」での分析タイプの選択によって異なります。
要約分析 - Survオブジェクト、Kaplan-Meier推定オブジェクト
グループ分け分析 - Survオブジェクト、Kaplan-Meier推定オブジェクト、Cox比例ハザードオブジェクト
因子分析 - Survオブジェクト、Cox比例ハザードオブジェクト
Cox PHモデルは、O出力の出力の第2要素から直接アクセスすることができます。そのモデルが「モデル」である場合、SurvオブジェクトとKMestオブジェクトはそれぞれ「modelKMest」によってアクセスできます。
Rアンカー: [分析オプション]の下の[分析タイプ]の選択に応じて、Survival Analysis(生存分析)ツールで生成されたレポートスニペットで構成されます。
要約分析 - 要約統計と生存関数のグラフ。
グループ分け分析 - 要約統計量。観察されたもの対各グループの期待される結果。 Logrank、Likelihood Ratio、およびWaldテストのグループの類似性に関するグループ比較テスト結果。異なるグループの生存曲線を比較するグラフ。各グループの明確な生存曲線と累積ハザード曲線。
因子分析 - 要約統計量、Logrank、Likelihood Ratio、およびWaldテストの予測変数の影響に関する因子分析テスト結果。予測因子の影響を列挙するCox比例ハザードモデルの要約。
Dアンカー: 要約とグループ分け分析(この場合グループを特定する追加のフィールドが追加される)では、生存曲線のKaplan-Meier推定が作成されます。これは因子分析には提供されません。
*https://en.wikipedia.org/wiki/Survival_analysis
**https://stat.ethz.ch/R-manual/R-devel/library/survival/html/coxph.html