Skip to main content

予測分析

Designerには、統計分析と予測分析に使用されるオープンソースコードベースのRを使用する一連の予測ツールが含まれています。

これらのツールは、データ探索、予測分析のためのデータ準備の専門的要素、予測モデル、さまざまなモデルの有効性を比較し評価するツール、計画的な方法でレコードとフィールドをグループ化するツール、予測分析ソリューションの展開を支援するツールなどから成っています。

予測ツールはRプログラミング言語を使用します。オプション > 予測ツールをダウンロード の順に進み、Alteryx Downloads and Licenses ポータルにサインインして、R と R ツール で使用されるパッケージをインストールします。

インデータベースサポート

インデータベースでサポートされる6つの予測ツールがあります。

インデータベースでサポートされる予測ツールが別のIn-DBツールを使用してキャンバスに配置されると、予測ツールはIn-DBバージョンに自動的に変更されます。ツールのバージョンを変更するには、ツールを右クリックし、[ツールバージョンの選択] をポイントして、別のバージョンのツールを選択します。インデータベースのサポートとツールの詳細については、インデータベースの概要 を参照してください。

予測分析ツール

このツールカテゴリには、予測分析プロジェクトで使用されるデータをよりよく理解するためのツールと、予測分析のための特殊なデータサンプリングタスクを実行するためのツールが含まれています。予測分析プロジェクトで使用されているデータをよりよく理解するためのツールには、可視化ツールと説明統計のテーブルを提供するツールがあります。

次のツールは視覚的手法を用い、ユーザーが分析するデータをより深く理解することを助けます。

Field Summary Tool Icon
Heat Plot Tool Icon
Histogram Tool Icon
Plot of Means Tool Icon
Scatterplot Tool Icon
Violin Plot Tool Icon

ユーザーが分析されるデータをよりよく理解するのに役立つ要約統計情報を提供するツールは、次のとおりです。

Magnifying glass over a rain drop and umbrella symbol
Basic Data Profile Tool Icon
Contingency Table Tool Icon
Distribution Analysis Tool Icon
Frequency Table Tool Icon
Importance Weights Tool Icon
Pearson Correlation Tool Icon
Spearman Correlation Tool Icon

このカテゴリには、分類(カテゴリターゲットフィールド)と回帰(ニューメリックターゲットフィールド)モデルの両方に向けた一般的な予測モデリングのツール、モデル比較用ツール、予測モデリングに関連する仮説テスト用ツールが含まれます。一般的な予測モデリングのための一連のツールは、従来の統計モデルと、より現代的な統計学習方法とに、さらに分類することができます。単一の[スコアリング]ツールは、両方のタイプの一般的な予測モデリングツールからモデル予測を取得するためのメカニズムを提供します。

伝統的な統計モデルとより現代的な統計的学習方法との間の重要な差異は、モデリングプロセスにおける直接のユーザー介入のレベルです。伝統的な統計モデルは、適切なレベルの予測効力を持つモデルを開発するために、はるかに高いレベルのユーザー介入と専門知識を必要とします。具体的には、ユーザーは重要な予測フィールドを事前に選択しなければならず、ターゲットフィールドと連続予測の間の非線形効果を捕捉するために、数値フィールドに適切な変換を適用する必要が高くなります。重要な予測(非線形関係に起因する可能性のある問題を無視する)の選択は、従来のモデルではステップワイズ回帰を使用することで支援されます。対照的に、現代の統計学的学習方法は、予測因子の選択と、ターゲットと数値予測間の非線形関係の両方に、内部的に処理するアルゴリズムを利用します。

伝統的な統計モデルは、予測されているターゲットフィールドの性質に基づいて互いに異なります。それらのすべては、(一般化された)線形モデルの推定に基づいています。すべての統計学習アルゴリズムは、内部で予測選択と非線形効果を処理するという共通の特性を持っていますが、それぞれ異なるアプローチを用いています。その結果、ユーザーが遭遇しそうな一連の問題にわたって、他のすべてをしのぐ唯一のメソッドはありません。

伝統的な統計モデル用のツール

Count Regression Tool Icon
Gamma Regression Tool Icon
Linear Regression Tool Icon
Logistic Regression Icon
Naive Bayes Classifier Tool Icon
Neural Network Tool Icon
Stepwise Tool Icon
Support Vector Machine Tool Icon

現代的な統計学習メソッドのツール

Boosted Model Tool Icon
Decision Tree Tool Icon
Forest Model Tool Icon
Spline Model Tool Icon

予測モデル比較と仮説検定のためのツール

Cross-Validation Tool Icon
Lift Chair Tool Icon
Model Coefficients Tool Icon
Model Comparison Tool Icon
Nested Test Tool Icon
Test of Means Tool Icon
Variance Inflation Factors Tool Icon

すべての一般的な予測モデリングツールの値を予測するツール

Score Tool

インタラクティブなネットワーク視覚化と主要な要約統計情報を作成するツール

Network Analysis Tool Icon

生存モデルを生成し、相対リスクおよび制限された平均生存時間を推定するためのツール

Survival Analysis Tool Icon
Survival Score Tool Icon

ABテストツールは、販売に関する新しいマーケティングコミュニケーションキャンペーンの効果や店舗スタッフのレベルの変更の影響を調べるなど、A / Bテスト(テストと学習としても知られています)を実行する際に役立ちます。このツールは、テスト(通常、マスメディア広告を含むテストで、そのエリアに住むすべての人が広告にさらされる可能性があります)のマーケットエリアを決定すること、1つ以上のコントロールユニットを各処置群に一致すること、処置とコントロールのマッチングに基づき傾向と季節性の指標を開発すること、そして実際に実験結果を分析することに役立ちます。このサブカテゴリに関連するツールは次のとおりです。

AB Analysis Tool Icon
AB Controls Tool Icon
AB Treatments Tool Icon
AB Trend Tool Icon

このカテゴリには、いくつかの定期的な(毎月など、データの時間間隔)単変量時系列のプロットと予測ツールが含まれます。なかでも中心的なものは、ARIMAツールや拡張指数関数的スムージング予測モデルを作成するためのツールで、週に一度の販売予測モデルなどのアイテムを作成するために使用できます。これらの方法はどちらも、ターゲット変数の値の体系的な時間関連要素に基づいて予測を作成します。具体的には、傾向の要素(ターゲット変数の、長期的にかなり一貫した上向きまたは下向きの動き)と季節性(時間の経過と共に繰り返す周期的なパターン)を取り上げます。

これらの要素の具体例としては、タブレットコンピュータ販売の時系列モデルは、クリスマス頃と新学年度の開始前という一定の季節パターンで高い売上を示す傾向が高くなっています。傾向も季節性もターゲット変数に存在しない場合、ターゲット変数の予測値は、ターゲットの最新の値に対するターゲットの加重平均値に基づいて、直線に向かう可能性があります。これはユーザにとっては不満足な発見となる可能性が高いですが、時間関連要素(傾向および季節性)に関してのみデータには実際の構造が存在しないことを示しています。このような場合、時系列ツールよりも、より一般的な予測モデリングメソッドの方が、予測を開発する上でずっと役に立つことがあります。

予測を作成するためのツールに加えて、ユーザーが異なる時系列予測モデルの相対的効力を比較するのに役立つツールもあります。時系列ツールの完全なセットは次のとおりです。

ARIMA Tool Icon
ETS Tool Icon
TS Compare Tool Icon
TS Covariate Forecast Tool Icon
TS Filler Tool Icon
TS Forecast Tool Icon
TS Forecast Factory Tool Icon
TS Model Factory Tool Icon
TS Plot Tool Icon

このカテゴリには、レコードまたはフィールドを少数のグループに分けるためのツールが含まれています。レコードをまとめてグループに分ける一般的な用途には、購買パターンに基づいて顧客セグメントを作成したり、ストアグループのセットを作成することがあります。この2つの分野でグループに分ける究極の目的は、ビジネスの観点から実現可能な方法でプログラムや活動のカスタマイズを可能にする少数のグループを作成することです。

たとえば、ネットワークに500の直販店がある小売業者は、500店舗それぞれに特化したマーチャンダイジングや価格設定プログラムを開発することを大変な負担と感じるかもしれません。しかし、直販店がその販売パターンの類似性に基づいて店舗グループの小さなセット(たとえば10)に分けられている場合、10種類の異なるマーチャンダイジングと価格設定プログラムを作成することは実行しやすいでしょう。同様に、多くの組織では、分析したいデータベーステーブルが非常に幅広く、多くのフィールドが互いに高度に相関しています。このような場合、相関性の高い多数の測定値を扱うことは、これらのデータを用いて行われた分析を非常に複雑にします。その結果、元のフィールドセットを、より容易に分析に役立たせるより小さな複合フィールドセットに縮小することが理にかなっているかもしれません。これらの両方の場合において、データの次元性を低減してそれを実行可能にする必要があります。

レコードをグループ化するために使用される最も一般的なメソッドは、クラスター解析です。実際にはさまざまな種類のクラスター解析がありますが、ビジネスアプリケーションで最も一般的に使用されるクラスタリングメソッドは、Kセントロイドアルゴリズムに基づいています。Alteryxは、形成すべき適切な数のクラスター(グループ)を決定し、最終的なクラスターセットを作成し、特定のレコードが属するクラスターを付加するためのツールを(レコードがクラスターセットの決定に使用されたかどうかに関わらず)データに提供します。関連するツール(最近傍探索ツール)では、ユーザーが1つ以上の特定レコードの周りに所定サイズのアドホックグループを形成できます。たとえば、このツールを使って、過去の購入行動に基づいて顧客「X」に最も似ている5人の顧客を見つけることができます。フィールドのグループに分けるために使用できるメソッドは、主成分分析です。

マーケットバスケット解析ツール類は、どの品目がPOSデータに含まれているか、また欠陥報告や作業指示システムにおいてどの問題が一緒に発生する傾向があるかを判断するのに役立ちます。カテゴリ内のツールは、データ内の「ルール」のセットを決定し(たとえば、「製品欠陥BおよびCも観察された場合、製品欠陥Aが存在する可能性が高い」など)、フィルタリングツールによって、それらのルールを一定の基準に照らし合わせた際に重要度が高まる可能性をフィルターして、可能なルールを絞り込みます。

このカテゴリのツールは次のとおりです。

Append Cluster Tool Icon
Find Nearest Neighbors Tool Icon
K-Centroids Cluster Analysis Tool Icon
K-Centroids Diagnostics Tool Icon
MB Affinity Tool Icon
MB Inspect Tool Icon
MB Rules Tool
Multidimensional Scaling Tool Icon
Principal Components Tool Icon

このカテゴリには、特定の状況または一連のシナリオに対する最善のアクションや成果を判断するのに役立つツールが含まれます。最適なアクションを指定することによって、予測モデルの出力を増やすのに役立ちます。

Optimization Tool Icon
Simulation Sampling Tool Icon
Simulation Scoring Tool Icon
Simulation Summary Tool Icon