Skip to main content

Score Tool スコアリングツール

ツールごとに学習

スコアリングツールには「ツールごとに学習」が用意されています。サンプルワークフロー を参照して、Alteryx Designerでこのサンプルやその他の多くのサンプルに直接アクセスする方法を確認してください。

スコアリングツールは、提供された一連の予測変数にRモデルを適用して、ターゲット変数の推定を作成します。ターゲット変数がカテゴリ別になっている場合、予測変数に基づくレコードが各カテゴリに属する確率を提供します。ターゲット変数が連続の場合は、ターゲット変数の値を推定します。モデルのパフォーマンス評価に使用できますが、それ単独では評価を行いません。

このツールはRツールを使用します。オプション 予測ツールのダウンロード に移動し、Alteryx ダウンロードとライセンス ポータルにサインインして、Rツール で使用されるパッケージと Rツールをインストールします。予測ツールのダウンロードと使用 を参照してください。

モデルタイプ

スコアリングツールでは、さまざまな場所からモデルを評価できます。

  • ローカルモデル: このモデルは、ローカルマシンからワークフローに取り込まれるか、データベース内でアクセスされます。

  • Promoteモデル: このモデルはPromoteモデル管理システムに格納されます。

ローカルモデルの設定

スコアリングツールは、標準ワークフローによってアクセスされるモデル、またはIn-DBスイートを使用してアクセスされるモデルに対して構成できます。

標準処理のためのツール設定

入力の接続

スコアリングツールには、次の2つの入力が必要です。

  • Rベースの予測ツールで作成されたモデルオブジェクト。

  • モデル構成で選択された、予測フィールドを含むデータストリーム。これは、標準のAlteryxデータストリームまたはXDFメタデータストリームです。

これらの入力を[スコアリング]ツール入力に接続して設定を開始します。

サポートされているモデル

スコアリングツールは、RevoScaleR関数を使用して推定された場合でも、予測モデルからのデータストリームを使用できます。XDFメタデータストリームは、モデル作成ツールへの入力がXDF出力ツールまたはXDF入力ツールからで、モデルがRevoScaleR関数を使用して推定された場合にのみ使用できます。

標準のAlteryxデータストリームで推定されたモデルはOracleデータソースのスコアリングに使用できますが、Oracleデータソースに接続されたIn-DB予測ツールを使用してOracle R Enterpriseによって推定されたモデルは、標準のAlteryxデータストリームをスコアリングすることができません。

設定

このオプションによる調整は、ターゲットがバイナリカテゴリ変数である場合にのみ有効です。

  • 新しいフィールド名(連続ターゲット)または接頭辞(カテゴリターゲット): フィールド名または接頭辞は文字で始まる必要があり、文字、数字、および特殊文字ピリオド(.)およびアンダースコア(_)を含むことができます。Rは大文字と小文字を区別します。

  • ターゲットフィールドにオーバーサンプリング値を含む: これらのフィールドは、真のサンプルパーセンテージにマッチする適合確率を調整するために使用します。以下を提供する場合に選択します。

    • オーバーサンプリングされたターゲットフィールドの値: オーバーサンプリングされたフィールドの名前。

    • オーバーサンプリング前の元のデータのオーバーサンプリング値のパーセンテージ: オーバーサンプリング中に繰り返された値のパーセンテージ。

  • 非正規化線形回帰のみのオプション

    OREで作成したモデル

    OREで作成したモデルを使用する場合は、信頼間隔を計算するために元の推定テーブルがデータベースに存在する必要があります。

    • ターゲットフィールドは自然対数変換されています: 値を元のスケールに戻す変換を適用し、スミアリング推定を使用して後続の変換バイアスを考慮します。

    • 予測信頼区間を含める: 信頼区間の計算に使用する値を指定する場合に選択します。

  • XDF入力特有のオプション:

    • XDF入力ファイルにスコアリングを追加する: スコアリングをAlteryxデータストリームに置くのではなく、XDF入力ファイルに付加する場合に選択します。

  • 一度にスコアリングするレコード数: 1つのグループ内のレコード数を選択します。入力データは、Rのメモリ内処理の制限を回避するために、一度に1つのグループごとにスコアリングされます。

インデータベース処理のためのツール設定

スコアリングツールは、Oracle、Microsoft SQL Server 2016、およびTeradataのインデータベース処理をサポートします。インデータベースのサポートとツールの詳細については、インデータベースの概要 を参照してください。

In-DBバージョンのスコアリングツールにアクセスするには:

  • キャンバスにIn-DBツールを配置します。スコアリングツールはIn-DBのバージョンに自動的に変更されます。

  • スコアリングツールを右クリックし、[ツールバージョンを選択]をポイントして、In-DBバージョンを選択します。

予測インデータベースのサポートの詳細については、予測分析を参照してください。

入力を接続

スコアリングツールには、次の2つの入力が必要です。

  • Rベースの予測ツールで作成されたモデルオブジェクト。

  • モデル構成で選択された、予測フィールドを含むデータストリーム。これは、標準のAlteryxデータストリームまたはXDFメタデータストリームです。

これらの入力を[スコアリング]ツール入力に接続して設定を開始します。

サポートされているモデル

スコアリングツールは、RevoScaleR関数を使用して推定された場合でも、予測モデルからのデータストリームを使用できます。XDFメタデータストリームは、モデル作成ツールへの入力がXDF出力ツールまたはXDF入力ツールからで、モデルがRevoScaleR関数を使用して推定された場合にのみ使用できます。

Oracleデータソースに接続されたIn-DB予測ツールを使用してOREによって推定されたモデルは、標準のAlteryxデータストリームをスコアリングすることはできませんが、標準のAlteryxデータストリームで推定されたモデルを使用してOracleデータソースをスコアリングすることはできます。

設定

その他の特殊文字は使用できず、Rは大文字と小文字を区別します。

  • 出力テーブル名: 結果が保存されるデータベースのテーブル名を入力します。

  • 新しいフィールド名(連続ターゲット)または接頭辞(カテゴリターゲット): フィールド名または接頭辞は文字で始まる必要があり、文字、数字、および特殊文字ピリオド(.)およびアンダースコア(_)を含むことができます。

  • ターゲットフィールドにオーバーサンプリング値を含む: これらのフィールドは、真のサンプルパーセンテージにマッチする適合確率を調整するために使用します。このオプションによる調整は、ターゲットがバイナリカテゴリ変数である場合にのみ有効です。以下を提供する場合に選択する:

    • オーバーサンプリングされたターゲットフィールドの値: オーバーサンプリングされたフィールドの名前。

    • オーバーサンプリング前の元のデータのオーバーサンプリング値のパーセンテージ: オーバーサンプリング中に繰り返された値のパーセンテージ。

  • 線形回帰のみのオプション:

    OREで作成したモデル

    OREで作成したモデルを使用する場合は、信頼間隔を計算するために元の推定テーブルがデータベースに存在する必要があります。

    • ターゲットフィールドは自然対数変換されています: 値を元のスケールに戻す変換を適用し、スミアリング推定を使用して後続の変換バイアスを考慮します。

    • 予測信頼区間を含める: 信頼区間の計算に使用する値を指定する場合に選択します。

  • Teradata固有の設定: Microsoft Machine Learning Serverには、使用される特定のTeradataプラットフォームに関する追加の設定情報が必要です。この情報は、通常、ローカルのTeradata管理者によって提供されます。

    • Rのバイナリ実行可能ファイルへのTeradataサーバーパス。

    • Microsoft Machine Learning Serverで使用される一時ファイルの書き込み場所。

モデルソース(Oracleのみ)

  • モデルソース: スコアリングツールの(M)入力に渡されるモデルオブジェクトのソースを選択します。これは次のいずれかです。

    • データベース内では、データストリームの「名前」フィールドの値によって識別されます。

    • データストリームの「オブジェクト」フィールドに含まれます。

出力の表示

出力には、モデルの予測値を含む元のデータストリームが含まれます。カテゴリターゲットを使用するモデルの場合、ターゲット変数の各レベルの予測確率は、ユーザーが提供する接頭辞と、ターゲット変数の可能なレベルに対応するフィールドの接尾部で構成されるフィールド名で提供されます。

Promoteモデルの構成

Promoteは、予測モデルを展開、管理、スケーリングするためのプラットフォームです。Alteryxは、Promoteプラットフォームに接続して、保存されたモデルにアクセスし、それをスコアリングすることができます。

Promote資格情報

  • [Alteryx Promote接続]を確立します。

  • Alteryx Promote接続: 保存されたPromote接続からの選択に使用するドロップダウンリスト。

  • 接続の追加: 利用可能なPromote接続の一覧に追加するオプション。Promote接続マネージャーは、ワークフローとは独立して作動します。

Promote接続の追加

  1. [接続の追加]をクリックします。

  2. [接続の追加] ウィンドウでモデルが格納されている場所を指す[Alteryx Promote URL]を入力します。

  3. [次へ] を選択します。

  4. Alteryx Promote認証ウィンドウで、[ユーザー名]と[APIキー]を入力します。

  5. [接続]を選択します。

  6. 成功した場合、[接続済み] ウィンドウで、[完了]を選択します。新しい接続が選択され、ドロップダウンに表示されます。

Promote接続の削除

  1. 利用可能な接続を[選択]します。

  2. [接続の削除]を選択します。

  3. 確認ウィンドウで、URLとユーザー名が削除する接続に関連付けられていることを確認します。

  4. [OK]を選択します。この接続は、ドロップダウンでは使用できなくなりました。

Promoteへのアクセス

Promote機能へのアクセス権があるかどうか不明な場合や、アクセスに必要な資格情報を検索するサポートが必要な場合は、ローカル管理者またはサポート担当者に問い合わせてください。

モデルの選択

アクセスできるモデルのリストが生成されます。リストをスクロールするか、検索機能を使用してスコアリングするモデルを探し、モデルパスを選択します。

モデルパスを選択すると、そのモデルに関する情報が追加されます。

  • 名前: モデルの名前。

  • 所有者: モデルの所有者。

  • ステータス: モデルの現在の状態。アクセシビリティを反映します。

    • オンライン: モデルは最新で、データを処理する準備ができています。

    • 構築中: モデルは現在更新中で、データを処理できません。

    • 失敗した単体テスト: モデルの構築は終了しましたが、コンポーネントを正しく構築できませんでした。モデルはデータを処理できません。

    • 失敗しました: モデルは正しく構築できなかったため、データを処理できません。

    • オフライン: モデルは構築されていないため、データを処理できません。

  • 最終更新: モデルが最後に構築されたタイムスタンプ。

モデルがデータ処理に使用可能であることを確認し、 完了選択します。

設定の概要

構成の要約 は、使用される資格認定書の要約と選択されたモデルのモデル要約を提供します。